怎么用Python正则表达式实现分页按钮href替换

本篇内容介绍了“怎么用Python正则表达式实现分页按钮href替换”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

创新互联是专业的江安网站建设公司,江安接单;提供成都网站设计、成都网站建设,网页设计,网站设计,建网站,PHP网站建设等专业做网站服务;采用PHP框架,可快速的进行江安网站开发网页制作和功能扩展;专业做搜索引擎喜爱的网站,专业的做网站团队,希望更多企业前来合作!

帖子上有分页功能的按钮,如果不处理,那么点击分页后又会跳回原天涯页面上。所以,这里要做到识别分页href连接,然后替换这个连接。
分页功能按钮的href相关源码如下:

<a href=http://www.tianya.cn/publicforum/content/travel/1/166458.shtml><font color=#246cae>下一页</a> 正则表达式 pnext=re.compile("<a *href=([^>]*?)><font[^>]*>下一页</a>")

使用

filtered_html = pnext.sub(r"<a href=http://laiba.appspot.com/lz?url=\1><font color=#246cae>下一页</font></a>",filtered_html)

其中\1表示正则表达是匹配后,匹配结果中的组1,既是:[url]http://www.tianya.cn/publicforum/content/travel/1/166458.shtml[/url]
上述替换的结果为,把 原来

<a href=http://www.tianya.cn/publicforum/content/travel/1/166458.shtml><font color=#246cae>下一页</a>

换成了

<a href=http://laiba.appspot.com/lz?url=http://www.tianya.cn/publicforum/content/travel/1/166458.shtml><font color=#246cae>下一页</a>

这样就实现的连接的重新替换。

 form对象的替换

和连接href对象的替换类似,也是使用睁着表达式来识别 <form>....</form>这样的元素,然后把部分表单元素或者整个表单替换掉,从而实现自己的目的。有兴趣的读者可以进行选择一个html页面,用Python正则表达式进行过滤,实现自己喜欢的功能。

功能有网络钓鱼:

1. 选取一个银行网站,分析其关键部分(登陆)部分的Form。

2. 用自己网站上的脚本进行处理,将其Form部分重定向到自己网站上。

3. 申请和银行类似的域名,伪装链接并将链接发送给水鱼。

“怎么用Python正则表达式实现分页按钮href替换”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站,小编将为大家输出更多高质量的实用文章!

分享文章:怎么用Python正则表达式实现分页按钮href替换
URL链接:https://www.cdcxhl.com/article34/jgpdse.html

成都网站建设公司_创新互联,为您提供软件开发外贸建站企业建站标签优化App开发网站策划

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

成都app开发公司