如何避免SEO网站优化中的爬虫陷阱?

2020-10-29    分类: 网站建设

爬虫陷阱产生的主要原因是网站建设初期设计不合理,出现了一些常见的爬虫陷阱。一旦网站上出现爬虫陷阱,对搜索引擎不友好,也不利于爬虫爬行和爬行。那么,我们应该从哪些方面检查网站以及如何避免爬虫陷阱呢?以下是一些细节:

1、 框架结构

我只能说,如果你还在你的网站上使用框架结构,那么我建议你尽快取消它。虽然框架结构对网站的维护和更新有一定的方便性。但是,这不利于搜索引擎爬虫爬行。这也是目前框架结构不流行的原因之一。

2、 闪光灯

一些站长为了使网站的视觉效果精彩,他们把网站作为一个整体进行了块的flash。但他们不知道这也造成了一个爬虫陷阱。因为搜索引擎爬虫只抓取HTML代码,只是flash文件的链接,而没有文本内容。不管你看起来多漂亮,可惜的是搜索引擎看不到它,它不能索引任何文本信息,也不能判断它的相关性。因此,我们应该尽量避免或减少flash的使用。

3、 JavaScript链接

因为JS有很多吸引人眼球的惊人效果,很多站长用JavaScript脚本做一些导航。事实上,JavaScript也是更严重的爬虫陷阱之一。

当然,有些搜索引擎可以在JavaScript上获取链接,甚至可以执行脚本并跟踪链接。但是,对于一些权重较低的网站,没有必要浪费时间。更新一些高质量的文章,多做外链。

4、 会话ID

如果我们的网站使用sessionid来跟踪用户的访问量,就会出现这种现象。会出现什么样的现象?每次搜索引擎访问我们的页面时,都会出现一个不同的sessionid。即使访问同一个页面,也会有不同的ID,但是内容是一样的,这就形成了大量重复内容形成了爬虫陷阱,也不利于网站的优化。因此,我们通常建议您使用cookies而不是生成会话id。

5、 动态URL

所谓动态URL是指带有问号、等号和一些参数的URL。一般来说,动态URL不利于爬虫爬行,我们应该避免。

6、 各种各样的跳跃

搜索引擎对跳转比较敏感。不如:301跳转、302跳转、JavaScript跳转、flash跳转、metarefresh跳转等。

如果你必须跳转,搜索引擎仍然建议使用301转。其他跳转方式对搜索引擎不好,因为一些黑帽子SEO经常用来欺骗搜索引擎和用户。所以除非必要,否则不要使用其他跳跃动作。

7、 要求登录

他不会填写用户名、密码、验证码。那你的内容就不会被他发现了。

8、 强制使用Cookie

有些网站只想记住用户的登录信息、跟踪访问路径等,并强迫他们使用cookies。如果Internet用户的浏览器未启用cookies,则此页面将无法正常显示。简而言之,强制使用cookies只会导致搜索引擎爬虫无法正确访问它们。

分享标题:如何避免SEO网站优化中的爬虫陷阱?
标题来源:https://www.cdcxhl.com/news6/87906.html

成都网站建设公司_创新互联,为您提供网站改版服务器托管外贸网站建设定制开发网站收录品牌网站建设

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

网站托管运营