find_all的用法 Python,bs4,BeautifulSoup

find_all()简单说明:

find_all()

find_all() 方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件

用法一:

rs=soup.find_all('a')

将返回soup中所有的超链接内容

类似的还有rs.find_all('span')、rs.find_all('title')、rs.find_all('h1')

也可加入查找条件,eg:

rs.find_all('img',{'class':'news-img'})

将返回所有的class属性为news-img的img内容

用法二:

这里的true指的就是选中所有有id这个属性的标签

soup.find_all(id=True)

返回结果:

[<a class="sister" href="http://example.com/elsie" >Tillie</a>]

用法三:

soup.find_all("a", string="Elsie")

通过 string 参数可以搜搜文档中的字符串内容.与 name 参数的可选值一样, string 参数接受 字符串 , 正则表达式 , 列表, True

用法四:

soup.find_all("a", limit=2)

limit即为查找的数量,此处查找数量为两次