2021-01-28 分类: 网站建设
几乎我们每天都会使用头条等新闻APP,我们常常发现,新闻APP背后的大数据系统总是能够推荐我们,今天创新互联以最通俗易懂的方法,来讲讲大数据是怎么发现我们喜欢的东西的。
首先,当有作者在新闻后台撰写一篇文章后,文本分析引擎会对整篇文章进行分词,什么叫分词呢?通俗易懂的讲,就是对文章进行断句。例如下面这个句子,“中国移动采购5G终端13100台,华为占比近半”,机器通过分词算法后,就会变成"中国移动/采购/5G/终端/13100/台,华为/占比/近半"。
分词完之后,机器就会开始提取关键词。什么是关键词呢?出现的次数越多,越有可能是关键词,语气词一般都不是关键词,名词是关键词的可能性更高。一般都会有一个大数据关键词库,会从跟大数据库里面的关键词进行配对。例如,上述例子中,最后成为关键词的就有可能是,中国移动、华为、5G。至于其他的词语,一般都比较通用或者很难表达准确的意思,所以不会被认为是关键词。
提取关键词之后,大数据推荐系统会根据算法,对关键词进行分类,例如上述例子中,关键词是中国移动、华为、5G,那么,文章就会被分类到科技类目下,根据而华为、中国移动、5G这些都是通信的词语,就会再一次被划分到通信类目下。于是,这篇文章就会被归纳到科技类目下,并且被打上通信、华为等标签。
那么,这个内容会推荐给谁呢?很显然,当然是推荐给对科技感兴趣的人啦。那么怎么知道哪些人对科技,对通信感兴趣呢?
在每一个互联网公司里面,每一个用户,都有一个用户画像,什么是用户画像呢?通俗易懂的说,就是大数据系统描述一个用户是什么样的呢?例如男、女等性别标签,用户所在城市等位置标签,用户多少岁等年龄标签,还有用户的喜好,例如喜欢旅行、喜欢数码、喜欢科技这样的种种爱好。
大数据怎么给用户打上标签呢?一般在用户第一次 接下来,大数据的后台都会时时刻刻地监视着用户的一举一动,例如同样是科技类目,如果连续给用户推荐5个谷歌的新闻5个微软的新闻,但用户不点击,大数据就可能会认为这个用户对国外的科技不感兴趣,以后就会倾向推荐国内的科技新闻,如果一直推荐科技新闻用户不感兴趣,大数据就会渐渐地认为这个人对科技不感兴趣,会逐渐减少这类新闻的推荐量。
同时,大数据除了对用户的画像不停地调整,也会对文章不停地调整,让用户不停地看到自己感兴趣的,而又优质的文章,所以不得不说,现在大数据是越来越懂用户了!这也是科技的发展,给人们生活带来的便利。
文章标题:大数据为什么总能猜出你喜欢啥,这么解释,小孩都能听懂
网页路径:https://www.cdcxhl.com/news16/97916.html
成都网站建设公司_创新互联,为您提供虚拟主机、品牌网站制作、静态网站、定制开发、网站策划、网站收录
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联
猜你还喜欢下面的内容