用户输入关键词进行检索,百度搜索引擎在排序环节要做两方面的事情:第把相关的网页从索引库中提取出来;第二,把提取出来的网页按照不同维度的得分进行综合排序。
“不同维度”包括:
(1)相关性。网页内容与用户检索需求的匹配程度,如网页包含的用户检查关键词的个数,以及这些关键词出现的位置;外部网页指向该页面所用的锚文本等。
(2)权威性。用户喜欢有一定权威性网站提供的内容,相应地,百度搜索引擎也更相信优质权威站点提供的内容。
(3)时效性。时效性结果指的是新出现的网页,且网页内承载了新鲜的内容。目前,时效性结果在搜索引擎中日趋重要
(4)重要性。网页内容与用户检查需求匹配的重要程度或受欢迎程度。
(5)丰富度。丰富度看似简单,却是一个覆盖范围非常广的命题,可以理解为网页内容丰富,可以完全满足用户需求;也可以理解为不仅可以满足用户单一需求,还可以满足用户的延展需求。
(6)受欢迎程度,指该网页是不是受欢迎
以上便是百度搜索引擎决定搜索结果排序时考虑的六大原则。那么,六大原则的侧重点是怎样的呢?哪个原则在实际应用时占比大呢?其实,在这里没有一个确切的答案。在百度搜索引擎早期,这些阈值的确是相对固定的,如“相关性"在整体排序中的重量可以占到七成,但随着互联网的不断发展,检索技术的进步,
网站建设数量的爆发式增长,相关性已经不是难题。于是,百度搜索引擎引人了机器学习机制,让程序自动产出计算公式,推进排序策略更加合理。
本文名称:搜索引擎检索排序
网站地址:https://www.cdcxhl.com/news/146755.html
成都网站建设公司_创新互联,为您提供域名注册、网站建设、云服务器、网站制作、网站策划、响应式网站
广告
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源:
创新互联