2021-07-05 分类: 网站建设
用户在搜索引擎中的行为主要包括搜索及点击。搜索是用户获取信息的过程,点击是用户得到需要信息后的表现。
用户的搜索及点击行为中蕴含着非常丰富、重要的信息。例如,在用户搜索行为中包含了“提交的关键字,,、。提交时间”、“用户IP地址”等信息;而在点击行为中则包含了“每个结果的点击次数”等信息。
搜索引擎通过对用户行为的分析可以进一步发掘用户的需求,提高搜索结果的精准度。例如,从用户的搜索行为中,搜索引擎还可以发现新词汇;而从用户对搜索结果的点击行为中,可以分析出用户对每个搜索结果的偏好等。
·搜索
搜索是用户获取信息的途径,是搜索引擎最基本的功能。搜索引擎可以在得知某.关键字被搜索的次数,通过对关键字被搜索的次数的分析,可以发现新词汇及进一步了解用户的搜索习惯。
由于语言是不断发展的,随着时间的推移会产生更多的新词汇。特别是在互联网环境中,某个热点的事件也有可能成为一个新的词语,例如“艳照门”等。
对搜索引擎而言,新生词汇主要是指那些目前搜索引擎词典系统里不存在、但是又被频繁搜索的关键字。如果某一关键字在搜索引擎词典系统里不存在,则切词时就不会产生该关键字'这样用户在查询该关键字时就返回不了相关的信息,也就不能满足用户的需求。因此,搜索引擎对新词汇的学习能力从一定程度上反映了搜索引擎对语言的理解能力,是衡量搜索引擎好坏的重要指标之一。
结合用户搜索习惯与页面内容发掘新关键字是搜索引擎学习新词汇的主要方式之一。
(1)对用户查询日志进行分析,筛选出日志中查询相对频繁的词汇;
(2)如果某个查询相对频繁的关键字不存在于词典系统中,就把这个关键字与部分页面的内容进行匹配;如果命中,则表明该关键字是存在的,加入词典系统;否则,对下一个查询频繁词
语进行匹配。
●点击
点击是用户找到所需信息后的表现,反映了用户对信息的关注。因此,用户对链接的点击也是衡量页面相关性的因素之一,是衡量页面相关性的一个重要补充。
在同一个关键字的搜索结果列表中,不同的用户会有不同的选择。但是,如果某一个结果的点击次数明显多于其他结果,则从一定程度上反映了该页面是大部分用户所需要的(特别是当该
链接处在比较靠后的位置时)。
众所周知,搜索结果中越靠前的链接得到点击的几率就会越高。按照这样的逻辑,那么在排在第二、第三甚至第四的页面被点击的机会就会变得越来越小,但这并不代表这些页面就不比排在前而的页面重要,只是在目前的排序结果中,用户还没机会发现它们而已。所以,对于不同位置上链接的点击,搜索引擎会对其权重值进行相应的补偿。假设排在第一位的结果每被点击一次会产生1分的补偿,而排名在100名的结果被点击一次则会产生10分甚至更多的补偿。
3缓存机制
为了能在极短的时间内响应用户的查询请求,搜索引擎除了在用户提交查询信息前就生成关键字对应的页面排序列表以外,还需要为那些查询最频繁的关键字对应的页面排序列表建立缓存机制。
经过统计,搜索引擎发现关键字查询的集中现象非常明显。查询次数最多的前20 010的关键字大约占了总查询次数的80a/o(就这是著名的80/20法则)。因此,只要我们对这20左右的关键字建立缓存就可以满足80u/o的查询需求。
由于用户查询时返回的信息主要是与关键字相关的页面排序列表,因此关键字缓存机制的建立主要是针对与关键字相关的页面排序列表。在对常用关键字的页面排序列表建立缓存后,搜索引擎就可以把缓存中的信息返回给用户,这样速度就会非常快,也就能满足绝大部分用户的需求。
由于互联网中的信息是时刻都在增长的,如果搜索引擎每次都向用户返回同样的信息,则不但用户得不到更高质量的信息,其他网站也不能向用户展示最新的高质量信息,从而造成信息滞后。因此,搜索引擎还会对缓存中的内容进行定期更新。
本文由上海专业网站建设公司创新互联(www.cdcxhl.com ),转载请注明。
网站栏目:用户在搜索引擎中的行为搜索及点击
当前路径:https://www.cdcxhl.com/news/118960.html
成都网站建设公司_创新互联,为您提供微信小程序、面包屑导航、响应式网站、ChatGPT、虚拟主机、网站建设
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联
猜你还喜欢下面的内容