本文共 1034 字,大约阅读时间需要 3 分钟。
CSS选择器
from bs4 import BeautifulSoup
soup = BeautifulSoup(open('web.html','r',encoding = 'utf-8'),'lxml')
print(soup.select('span')) #[logo] 返回一个列表print(soup.select('a')) #获取所有的a标签 返回一个列表
print(soup.select('.one')) #返回类名为one的class 返回一个列表print(soup.select('.left'))
print(soup.select('#menu')) #通过id进行查找要加警号 返回id是menu的标签 返回的是一个列表
print(soup.select('a[name = "aa"]')) #a标签下name属性为aa的标签print(soup.select('span[class = "f"]')) #span标签下类的f的输出
print(soup.select('div .left')) #查找div下的类为left的标签 print(soup.select('#header + #clear + #menu a')) #加号表示的意义是 下一个属性
```pythonprint(soup.select('a:nth-of-type(2)')) #[军事, bbbb, gggg]
```pythonprint(soup.select('#content > a')) #输出id为content的直接字标签a
print(soup.select('#menu a')[0].get_text()) #要闻 获取文本内容print(soup.select('#menu a')[0].text) #要闻 获取文本内容print(soup.select('#menu a')[0].attrs['href']) #http://www.baidu.com 获取属性print(soup.select('#menu a')[0]['href']) #http://www.baidu.com 获取属性
转载地址:http://wgydi.baihongyu.com/