python--获取html中标签的属性和内容-创新互联
下面介绍一下BeautifulSoup
和Parsel
的用法
现在我想要得到img
标签里的data-src
属性
把上面这些获取到的内容用json_data
保存
第一种方式先用BeautifulSoup
soup = BeautifulSoup(json_data, 'html.parser')
clearfix = soup.select('ul[]')
for i in clearfix:
for ii in i.find_all('img'):
data_src = ii.get('data-src')
print(data_src)
第二种方式Parsel
# Parsel的用法, 使用Selector类结合re
selector = Selector(json_data)
clearfix = selector.css(
'ul[]').re('data-src="(.*?)"')
两种方式都可以拿到html中的数据
据说第二种更快一些
如果是获取标签内的内容
新款现货Apple/苹果 iPhone 14 Pro Max官方正品手机14Pro灵动岛
tbRmbNum = selector.css('h3[] ::text').get()
你是否还在寻找稳定的海外服务器提供商?创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源,准确流量调度确保服务器高可用性,企业级服务器适合批量采购,新人活动首月15元起,快前往官网查看详情吧
当前名称:python--获取html中标签的属性和内容-创新互联
浏览路径:http://pwwzsj.com/article/ioigg.html