2020-10-29 分类: 网站建设
爬虫陷阱产生的主要原因是网站建设初期设计不合理,出现了一些常见的爬虫陷阱。一旦网站上出现爬虫陷阱,对搜索引擎不友好,也不利于爬虫爬行和爬行。那么,我们应该从哪些方面检查网站以及如何避免爬虫陷阱呢?以下是一些细节:
1、 框架结构
我只能说,如果你还在你的网站上使用框架结构,那么我建议你尽快取消它。虽然框架结构对网站的维护和更新有一定的方便性。但是,这不利于搜索引擎爬虫爬行。这也是目前框架结构不流行的原因之一。
2、 闪光灯
一些站长为了使网站的视觉效果精彩,他们把网站作为一个整体进行了块的flash。但他们不知道这也造成了一个爬虫陷阱。因为搜索引擎爬虫只抓取HTML代码,只是flash文件的链接,而没有文本内容。不管你看起来多漂亮,可惜的是搜索引擎看不到它,它不能索引任何文本信息,也不能判断它的相关性。因此,我们应该尽量避免或减少flash的使用。
3、 JavaScript链接
因为JS有很多吸引人眼球的惊人效果,很多站长用JavaScript脚本做一些导航。事实上,JavaScript也是更严重的爬虫陷阱之一。
当然,有些搜索引擎可以在JavaScript上获取链接,甚至可以执行脚本并跟踪链接。但是,对于一些权重较低的网站,没有必要浪费时间。更新一些高质量的文章,多做外链。
4、 会话ID
如果我们的网站使用sessionid来跟踪用户的访问量,就会出现这种现象。会出现什么样的现象?每次搜索引擎访问我们的页面时,都会出现一个不同的sessionid。即使访问同一个页面,也会有不同的ID,但是内容是一样的,这就形成了大量重复内容形成了爬虫陷阱,也不利于网站的优化。因此,我们通常建议您使用cookies而不是生成会话id。
5、 动态URL
所谓动态URL是指带有问号、等号和一些参数的URL。一般来说,动态URL不利于爬虫爬行,我们应该避免。
6、 各种各样的跳跃
搜索引擎对跳转比较敏感。不如:301跳转、302跳转、JavaScript跳转、flash跳转、metarefresh跳转等。
如果你必须跳转,搜索引擎仍然建议使用301转。其他跳转方式对搜索引擎不好,因为一些黑帽子SEO经常用来欺骗搜索引擎和用户。所以除非必要,否则不要使用其他跳跃动作。
7、 要求登录
他不会填写用户名、密码、验证码。那你的内容就不会被他发现了。
8、 强制使用Cookie
有些网站只想记住用户的登录信息、跟踪访问路径等,并强迫他们使用cookies。如果Internet用户的浏览器未启用cookies,则此页面将无法正常显示。简而言之,强制使用cookies只会导致搜索引擎爬虫无法正确访问它们。
网页题目:如何避免SEO网站优化中的爬虫陷阱?
文章分享:https://www.cdcxhl.com/news/87906.html
成都网站建设公司_创新互联,为您提供品牌网站制作、网站内链、电子商务、品牌网站设计、网站改版、品牌网站建设
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联
猜你还喜欢下面的内容