本篇文章为大家展示了利用BeautifulSoup怎么获取指定class样式的div标签,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
如何获取指定的标签的内容是解析网页爬取数据的必要手段,比如想获取<div class='xxx'> ...<div>这样的div标签,通常有三种办法,
1)用字符串查找方法,然后切分字符串(或切片操作),如str.index(patternStr)或str.find(patternStr),这种方法快,但步骤多,因为要去头去尾。
2)用正则表达式,比如'<div class="result_info">([\s\S]+?)</div>',通过正则表达式的括号,可以获取匹配的内容,即<div ..></div>之间的内容:
import re def getTags(html): reg = r'<div class="result_info">([\s\S]+?)</div>' pattern= re.compile(reg) tags= re.findall(pattern, html) return tags
新闻名称:利用BeautifulSoup怎么获取指定class样式的div标签-创新互联
转载来源:https://www.cdcxhl.com/article36/dojgpg.html
成都网站建设公司_创新互联,为您提供响应式网站、App开发、网站内链、网站设计公司、云服务器、网站排名
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联