python--获取html中标签的属性和内容-创新互联

下面介绍一下BeautifulSoup和Parsel的用法

创新互联网站建设由有经验的网站设计师、开发人员和项目经理组成的专业建站团队，负责网站视觉设计、用户体验优化、交互设计和前端开发等方面的工作，以确保网站外观精美、做网站、网站设计易于使用并且具有良好的响应性。

现在我想要得到img标签里的data-src属性
把上面这些获取到的内容用json_data保存
第一种方式先用BeautifulSoup

soup = BeautifulSoup(json_data, 'html.parser')

clearfix = soup.select('ul[]')

for i in clearfix:
   for ii in i.find_all('img'):
       data_src = ii.get('data-src')
       print(data_src)

第二种方式Parsel

# Parsel的用法, 使用Selector类结合re
    selector = Selector(json_data)
    clearfix = selector.css(
        'ul[]').re('data-src="(.*?)"')

两种方式都可以拿到html中的数据
据说第二种更快一些

如果是获取标签内的内容

新款现货Apple/苹果 iPhone 14 Pro Max官方正品手机14Pro灵动岛

tbRmbNum = selector.css('h3[] ::text').get()

你是否还在寻找稳定的海外服务器提供商？创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源，准确流量调度确保服务器高可用性，企业级服务器适合批量采购，新人活动首月15元起，快前往官网查看详情吧

网站标题：python--获取html中标签的属性和内容-创新互联
URL网址：https://www.cdcxhl.com/article16/ioigg.html

成都网站建设公司_创新互联，为您提供服务器托管、ChatGPT、软件开发、企业建站、网站制作、品牌网站建设

声明：本网站发布的内容（图片、视频和文字）以用户投稿、用户转载内容为主，如果涉及侵权请尽快告知，我们将会在第一时间删除。文章观点不代表本网站立场，如需处理请联系客服。电话：028-86922220；邮箱：631063699@qq.com。内容未经允许不得转载，或转载时需注明来源：创新互联

猜你还喜欢下面的内容