公司网站优化搜索引擎的工作过程

2022-06-21    分类: 网站建设

爬行和抓取

爬行和抓取是搜索引擎工作的第一步,完成数据收集任务.

蜘蛛

搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot).

蜘蛛代理名称:

百度蜘蛛:Baiduspider+(+http://www.baidu.com/search/spider.htm) ·

雅虎中国蜘蛛:Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html) ·

英文雅虎蜘蛛:Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)

Google 蜘蛛:Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) ·

微软 Bing 蜘蛛:msnbot/1.1 (+http://search.msn.com/msnbot.htm)·

搜狗蜘蛛: Sogou+web+robot+(+http://www.sogou.com/docs/help/webmasters.htm#07) ·

搜搜蜘蛛:Sosospider+(+http://help.soso.com/webspider.htm) ·

有道蜘蛛:Mozilla/5.0 (compatible; YodaoBot/1.0; http://www.yodao.com/help/webmaster/spider/; )

跟踪链接

为了抓取网上尽量多的页面,搜索引擎蜘蛛会跟踪页面上的链接,从一个页面爬到下一个页面,就好像蜘蛛在蜘蛛网上爬行那样,这也就是搜索引擎蜘蛛这个名称的由来.最简单的爬行遍历策略分为两种,一是深度优先,二是广度优先.

深度优先搜索

深度优先搜索就是在搜索树的每一层始终先只扩展一个子节点,不断地向纵深前进直到不能再前进(到达叶子节点或受到深度限制)时,才从当前节点返回到上一级节点,沿另一方向又继续前进.这种方法的搜索树是从树根开始一枝一枝逐渐形成的.

深度优先搜索亦称为纵向搜索.由于一个有解的问题树可能含有无穷分枝,深度优先搜索如果误入无穷分枝(即深度无限),则不可能找到目标节点.所以,深度优先搜索策略是不完备的.另外,应用此策略得到的解不一定是好解(最短路径).

分享名称:公司网站优化搜索引擎的工作过程
网页URL:https://www.cdcxhl.com/news/170000.html

成都网站建设公司_创新互联,为您提供外贸建站虚拟主机App设计动态网站定制开发用户体验

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

网站托管运营