一、提取文字内容:搜索引擎是对文字处理比较强,其次图片、视频等其他处理比较弱,理解:我们在站内和站外更新文章时候一定要以文字为主,没办法情况下才发其他内容.
二、停止词:什么叫停止词我们可以理解成讲话停顿出现的那个词就叫停止词,如你在哪里啊,你在干嘛呀,我的SEO优化, 等等,“啊”“呀”“的” “等”出现网页和互联网网页中最多次数不会被索引(写软文注意事项)
三、消躁:这两个词我们可以先有现实生活中理解他,消:消失,消除,躁:躁动因急躁而行动,躁汗心烦急躁,导致汗出,躁狂浮躁轻狂, 我们就知道搜索引擎索在提取你网页时先提取标题在提取文章内容给予比较高分数,而网页文章以外内容会给予比较低分数,如你想把关键词排名好分数高尽量出现在文章页里面,(站内和站外注意事项)
四、中文分词:里面有切词,正向匹配,逆向匹配,双向大匹配,词库:切词就是词与词之间把他分开来读,因搜索引擎只读一个词,在切词分开时搜索引擎有他切法,就是把词与词之间相关性用正向匹配在用逆向匹配以及双向大匹配得出来你文章内容相关性和可读性.稍微解释下:正向匹配:就是顺着词的组词在组词组词成语,逆向匹配:也是一样组词在组词组词成语.双向大匹配:有些词可正配也可逆配,词库:就是百度谷歌有他自己词典,来分析你网站网页文章中相关性(站内和站外文章相关性)
五、提取关键词信息:理解:搜索引擎提取所有互联网中网页关键词相关文章来进行对比,如网站网页信任度高分数高投票人多关键词合理安排又相关性强从而会把你页面排在比较靠前排名。
六、去重:理解:网页中重复在重复,搜索引擎检测你网页文章中太对不自然关键词
七、倒排索引(介绍正排与倒排):正排(以网页文件为主,以关键词为集合暂时储存数据库,倒排(以关键词为主,以网页文件为集合)数据库为准
八、链接计算(分值与相关性)外链/内链:网站网页尽可能跟文章内容有一定相关性 搜索引擎检计算出链接文章相关性强而得到较高分值。
九、页面过滤:就是搜索引擎会把所有互联网中网页文章内容进行对比如你网站网页内容是抄袭有可能会过滤掉不索引到数据库中,而那些信任度高
十、页面指纹(空间相量概念)搜索引擎提取网页文章进行MD5加密处理对比判断文章原创(信任度高网站网页会觉得你原创度高),百度谷歌判断文章原创不原创是用方向词的方向相量和大小力量进行分析得出结果.可以理解成 方向网页与网页进行对比看谁相似度高,大小力量是计算文章的内容相差大和相关性越强越原创.
新闻名称:在深圳如何能找到比较好的网站制作公司
路径分享:https://www.cdcxhl.com/news/138968.html
网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有网站制作等
广告
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源:
创新互联