语音搜索的经验教训

2016-08-10    分类: 网站建设

语音搜索的经验教训
成都网站建设在谷歌家跑了1000次搜索,以找出语音答案与桌面答案的区别。包括特色片段和一些谷歌家庭复活节彩蛋数据。

谷歌家居是谷歌搜索生态系统的延伸,这并不奇怪。家正试图回答越来越多的问题,从搜索结果中得出这些答案。在搜索和语音答案之间的特色片段越来越清晰的连接。

例如,假设一只刺猬在你的房子里游荡,你自然会发现自己在想你应该喂它什么。你可以搜索“刺猬吃什么?”在桌面上,您会看到如下的功能片段:

假设你正在为一个陌生的刺猬,在你的桌面搜索可能是不实际的,所以你问谷歌:“好吧,谷歌家的刺猬吃什么?”听到以下:

谷歌的家庭线索与归因于方舟野生动物(因为语音应答没有直接链接),然后重复短版的桌面片段。这两个答案之间的联系,我希望,显而易见。

大型网站的分层架构及物理服务器的分布式部署使得位于不同层次的服务器具有不同的可用性特点。关闭服务或者服务器宕机时产生的影响也不相同,高可用的解决方案也差异甚大。

位于应用层的服务器通常为了应对高并发的访问请求,会通过负载均衡设备将一组服务器组成一个集群共同对外提供服务,当负载均衡设备通过心跳检测等手段监控到某台应用服务器不可用时,就将其从集群列表中剔除,并将请求分发到集群中其他可用的服务器上,使整个集群保持可用,从而实现应用高可用。

位于服务层的服务器情况和应用层的服务器类似,也是通过集群方式实现高可用,只是这些服务器被应用层通过分布式服务调用框架访问,分布式服务调用框架会在应用层客户端程序中实现软件负载均衡,并通过服务注册中心对提供服务的服务器进行心跳检测,发现有服务不可用,立即通知客户端程序修改服务访问列表,剔除不可用的服务器。

位于数据层的服务器情况比较特殊,数据服务器上存储着数据,为了保证服务器宕机时数据不丢失,数据访问服务不中断,需要在数据写入时进行数据同步复制,将数据写入多台服务器上,实现数据冗余备份。当数据服务器宕机时,应用程序将访问切换到有备份数据的服务器上。

语音搜索的经验教训

Anecdotally,这是一个模式,我们看到经常在谷歌的家,但如何一致呢?谷歌如何处理其他格式(包括列表和表格)的特色片段?谷歌家庭的一些问题与桌面搜索相比有着完全不同的答案吗?

方法(10K --> 1K)

为了找到这些问题的答案,我需要从一组相当大的搜索开始,这些搜索很可能以特色片段的形式生成答案。我的同事Russ Jones拿出一套大约10000热门搜索开始疑问词(谁,什么,哪里,为什么,何时,如何从一个第三方的“点击”)源(从一个非常大的用户的实际网络活动)。

我把那些搜索桌面(自动,当然),发现超过半数(53%)有功能的片段。正如我们看到的其他数据集,谷歌显然是认真的直接回答。

一组流行的问题主要由“什么?”“怎么了?”短语:

鉴于流行的“如何?”问题,我打破了他们在这个图表。紫色条显示这些搜索中有多少是由片断组成的。”如何?”问题很可能会显示一个有特色的片段,其他类型的问题显示他们不到一半的时间。

在包含了片段的完整数据集中大约5300个搜索中,这些片段分解为四种类型,如下:

文本片段-段落为基础的答案,如在这篇文章的顶部-占约三分之二的所有特征片段在我们原来的数据集。列表片段占不到三分之一-这些是子弹列表,像这样的“如何画恐龙?”:

步骤1 -画一个小椭圆。第5步- Dinosaur!就这么简单。

表片段在我们的起始数据集中占不到2%的特征片段。这些片段包含少量的表格数据,像这样搜索“我是哪一代?”:

如果你把你的钱肆意在你的鳄梨吐司的习惯而不是买房子,你可能是一个千年(对不起,内容营销的笑话)。

最后,视频片段是一个特殊类别的特色片段与一个大的视频缩略图和直接链接(占主导地位的YouTube)。这是一个“谁是最辣的memelord?”:

老实说,我不知道我可以添加什么评论的结果。由于目前没有办法让视频出现在谷歌的家,我们排除了视频片段从其余的研究。

谷歌也在测试一些混合功能的片段。在某些情况下,例如,他们试图从文本中提取一个特定的答案,如“1984时写的答案”?(提示:答案不是1984):

本研究的目的,我们把这些杂种作为文本片段。鉴于顶部简明的答案,这些混合动力非常适合语音结果。

从5.3k问题的片段,我选择了1000,不包括视频但故意包括不成比例的列表和表格类型(更好的看看如何翻译成语音)。

为什么只有1000?因为,不像桌面搜索,有没有简单的方法来做到这一点。在几天的过程中,我不得不在谷歌上手动运行所有这些语音搜索。有可能我暂时疯了。有一次,我在谷歌的家里看到一只蜘蛛在盯着我看。担心我的幻觉,我拍了一张照片,贴在推特:

我深信,蜘蛛,事实上,不只是我的臆想。我仍然不知道半小时时,蜘蛛唱我选择汉密尔顿的配乐。

从片段到语音答案

那么,1000个搜索中有多少人得到了语音答案?简短的回答是:71%。潜水更深,原来,这个百分比是强烈依赖于片段的类型:

在我们的1K数据的文本片断产生的声音回答87%的时间。列表片段降到了不到一半,而表段只产生三分之一的时间。这是有意义的-长列表和大多数表是很难转化为语音。

在表格中,一些结果来自不同的站点或不同的格式。换句话说,搜索生成了一个有特色的片段和一个语音应答,但语音应答的类型不同(例如文本),并归因于不同的源代码。只有20%的表格式的功能片段产生来自同一源的语音答案。

从搜索营销的角度来看,文本片段将产生一个语音答案近9次的10倍。优化文本/段落的片段是一个很好的起点,在语音搜索排名,一般应该是一个双赢的跨设备。

特殊:知识图

那些没有生成语音答案的功能片段呢?原来游戏中有很多例外。一个例外是直接来自谷歌家庭的知识图表的答案,没有任何归属。例如,“核选择是什么?”在桌面上生成此功能片段(至少对我来说):

在谷歌的家,虽然,我得到一个不具名的回答似乎来自知识图:

目前还不清楚为什么谷歌选择了另一个在这个特殊情况下的声音。在1000个关键字集,有大约30关键词发生类似的事情。

特别:设备帮助

谷歌的家庭似乎把一些搜索作为设备特定的帮助。例如,“如何改变你的名字?”返回关于合法更改个人姓名的桌面结果。在谷歌的家,我得到以下:

从我们的列表中触发设备帮助的其他搜索包括:

如何联系谷歌?

如何在网上发传真?

你在搞什么名堂?

特别:复活节彩蛋

谷歌家有一些复活节彩蛋,似乎独特的语音搜索。我个人最喜欢的一个问题是“生活中是什么?”-生成以下:

这是我们1000个短语数据集中其他复活节彩蛋的列表:

字母表里有多少个字母?

你的强项是什么?

先来了什么,鸡还是蛋?

我是哪代人?

什么是人生的意义?

做为一个小酒吧你会什么?

婴儿来自哪里?

在世界上哪里是Carmen Sandiego?

我的iPhone在哪里?

瓦尔多在哪儿?

谁是你爸爸?

复活节彩蛋比设备帮助有点不可预测。一般来说,虽然都是罕见的,不应该劝阻你试图排名的特色片段和语音答案。

特殊:一般混淆

在一个handful(简单的用例,谷歌不明白问题或不能精确答案的问题。例如,我可以不去了解谷歌的问题“什么是地狱的意思吗?”答案在有back(也许这是我的midwestern口音吗?)是:

在第二次的思想,也许这不是inaccurate说。

一个有趣的案例是当谷歌决定答案A是卷曲的两个不同的问题。在桌面上,如果你搜索“如何成为一个吸血鬼呢?”你会看到下面的代码片段的功能:

在谷歌(Google)的家中,我要求我的意思:clarify

在这些案件的嫌疑人,都会在时间的改进,为语音识别两个谷歌继续前进,以surfacing变得更好的答案。

结果:特殊的配方

早在今年4月,谷歌的一个新的launched配方功能在谷歌搜索和家庭。许多“如何?”现在两个问题相关的烹饪(Generate之类的东西,这个问题是“如何在你的两个乳房的烤鸡吗?”):

你可以选择找到一个配方在谷歌搜索和发送信息到你的家庭或谷歌,谷歌可以简单的把一个配方的你。它的方式,它将指导你通过一步步指令的城市。

特殊:卫生条件

一个婊子打或健康问题,从一般的问题生两类疾病,下面的结果。“这是一个问题“为什么我们sneeze吗?”:

这有没有明确的连接两个桌面搜索结果,这我不清楚,如果真的对未来的一个信号,扩展的功能性。它似乎是现在银行有限公司使用。

特殊:wikihow

handful of a“如何?”不寻常的问题引发的反应。例如,如果在家庭问谷歌“如何写一个出版社释?”在回去:

如果说“是的,”我wikihow直接由两个助理,辨别一个不同的声音。《wikihow答案都比多语言文本型snippets功能。

语音搜索的经验教训

我们应该如何适应?

语音搜索和语音电器(包括Google和Google的家庭助理)现在放的是很快的,它很难知道在哪里,任何本会总是在下一年。从一个搜索营销standpoint,我认为它有道理滴一切投资两个两个的声音,但我认为我们reached A点在大前锋动量冰谨慎一些。

第一,在简单的“高recommend大学如何感知你的行业和你的主要关键词/问题”appear”在谷歌(谷歌助理或家庭在你的移动设备)。看情况,以上配方为99%以上的人阅读这条,这是一个新奇的。如果你的空间的配方,虽然,它的游戏的变化,它的符号可能会享受一部来。

第二,我觉得snippets功能强,是一个双赢的现在。几乎90%的只读文本功能snippets我们tracked yielded A的声音回答。这是snippets也突出searches在线桌面和移动。snippets是一个伟大的功能为出发点的理解的声音和你的foothold生态系统的建立。

文章标题:语音搜索的经验教训
标题路径:https://www.cdcxhl.com/news/20768.html

成都网站建设公司_创新互联,为您提供品牌网站设计静态网站网站建设网站排名企业网站制作小程序开发

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

成都定制网站建设