python爬虫,二十 select方法

有时候需要css选择器

1、通过标签名查找:

<style type="text/css">
      p{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p>123</p>
       <p>456</p>
</body>
print(soup.select('p'))

这时就可以查到123和456得数据

2、通过类名查找:

<style type="text/css">
      .line{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p  class="line">123</p>
       <p>456</p>
</body>
print(soup.select('.line'))

这样就可以查到123得数据

3、通过id查找:

<style type="text/css">
      #line1{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p  >123</p>
       <p>456</p>
</body>
print(soup.select('#sister'))

这样可以查到123得数据

4、通过组合查找:

<style type="text/css">
      .box  p{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p>123</p>
       <p>456</p>
</body>
print(soup.select('p #sister'))

这样可以得到box下面得p标签,123和456得值

5、通过属性查找

<style type="text/css">
      input[name='username']{
            background-color:pink;
        }
</style>
<body>
     <form>
     <input  type="text" name="username">
     </form>
</body>
print(soup.select('a[href="http://example.com/elsie"]'))

可以得到这个input标签