2014-02-09 分类: 网站建设
很多专业的seo技术人员都说,如果想要学习seo,首先你得知道搜索引擎的工作原理,其原因就是,知道搜索引擎原理,才能从实质出发,学习seo工作原理,首先我们得从这三部分下手,第一是,爬行和抓取:搜索引擎蜘蛛通过跟踪链接发现和访问网页,然后去读取页面中的HTML代码,存入到数据库里面。第二是,预处理:索引程序对那些抓取来的页面进行文字的提取、中文分词、索引、倒排索引等处理,这是用来排名程序的调用问题。第三是,排名:这也是大家最关心的,当用户输入关键词后,排名程序调用索引数据,计算相关性,然后按一定的格式生成搜索结果页面也就是关键词的排名。以下是具体的介绍,一起来了解一下。
第一、蜘蛛爬行和处理
百度蜘蛛程序会发出页面访问请求,这个时候服务器就会返回HTML代码,这个时候,蜘蛛程序就会把收到的代码存入到原始的页面数据库,而且搜索引擎未来提高爬行的速度,会使用多个蜘蛛进行分布爬行,当爬到网站的时候,第一件事是需要访问robots.txt协议,看哪些允许抓取,哪些不允许抓取,蜘蛛是会遵守协议的,对于蜘蛛抓取是有两种抓取形式的,一种是深度的抓取、另一种是广度优先抓取策略。但是百度蜘蛛抓取的网页太多所以并不是每一个都可以抓取到,那么这个时候我们就需要去吸引蜘蛛来抓取我们的网页,那么有哪些方法呢?
1、网站域名比较久,这样的域名网站蜘蛛会认为是质量高、资质老的网站,所以会优先深度去抓取内容。
2、网页的更新频率,这样的网站会根据网站每天生成的内容进行数据统计,然后发现每次都有新内容产出,那么就会经常去抓取。
3、导入链接。
4、URL结构等等。
第二、预处理
预处理在seo技术中也叫“索引”这是因为索引是预处理最主要的内容,前面说了蜘蛛抓取了网页的内容,那么这个时候就需要对内容去进行处理,因为针对于这个关键词有很多竞争对手,这时候需要选出最符合要求的内容来展示在最前面,这里主要就有提取内容的文字,中文分词,去停止词,消除噪声,去重正向索引和倒排索引,链接计算,质量判断这些工作去有价值的内容刷选。
第三、网站关键词排名
经过了前面两项的重重选择就开始对关键词进行排名了,这里的排名会经过一个关键词在网站的一个词频及密度,来体现关键词在网站的一个重要性,同时还会计算出相关性,接着就会进行过滤这个过滤是对于那些网站有作弊嫌疑的网站做的惩罚,最后就会确定好网站关键词排名,排名程序会调用原始页面的标题标签、说明标签、快照日期等数据据显示在页面上面。
不知道看到这里,大家对于搜素引擎的原理知道多少,在做网站优化排名的时候,千万不能操之过急,首先需要考虑到搜索引擎的工作原理,才能避免一些不必要的错误,在每一点上去规范优化操作技术。
网页题目:做seo搜索引擎工作原理你要知
URL分享:https://www.cdcxhl.com/news/5991.html
成都网站建设公司_创新互联,为您提供Google、小程序开发、域名注册、手机网站建设、虚拟主机、网页设计公司
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联
猜你还喜欢下面的内容