快好知 kuaihz

你的“声音”为什么成为了巨头们的战场?

这个场景你一定不陌生:一群人盯着手机,仿佛要被那小小的玻璃屏吸进去了。他们点啊,点啊,滑啊,等公交的时候是这样,走路的时候是这样,葛优瘫的时候是这样,甚至是热热闹闹的派对,也因为这样而了无生趣。自从10年前iPhone带着触摸屏问世以来,人类的整个世界,从抬头便成了低头。

今天,分析师预计,全世界安卓设备超过20亿台,苹果设备也有7亿台。一整代人——尤其是印度和中国等市场——都通过手机上网,敲键盘摁鼠标的时代呼啸而过。从前我们敲、敲、摁,现在我们点、点、滑。

这种火箭般的发展速度让设备制造商们不禁幻想,如果再出现什么爆款产品该多好啊。但眼下来看,似乎还没有什么能取代触摸屏手机。你看,谷歌眼镜、Apple Watch、Oculus Rift,这些前前后后问世的产品,有哪个能让大家把头抬起来?我们仍然是:点、点、滑。

然而,当我们把注意力都放在手腕和面部产品时,另一重大科技转变也在同时发生,并即将成为主流,这就是下一代计算界面——声音。声音也是世界上最古老的界面,我们通过它与他人交流,在文字和语言尚未诞生时,声音却早已存在。

起初,我们并不全然清楚手机能够引起多大的风潮,因为它连键盘都没有。而如今,它让我们足不出户,从一块玻璃屏中审视着全世界的信息。这种手指控制的视觉系统,原来拥有如此强大的力量。

然而,声音是自智能手机出现以来,人机交互历史上最大的变革。当语音设备出现,大家都开始说,好像缺了点什么:屏幕。尤其是对于我们大多数人来说,第一次和语音界面互动,就是通过触摸屏手机—— Siri。

不过,当键盘消失的时候,有趣的事情也就发生了:计算更加私人了。很快,我们下达的指令不会再有多复杂,可能只是一句话,可能是手指一点,或一个手势,一个转头,甚至是脸上的表情。如果计算机能准确解读这些信号,那么它们不仅能理解我们的表面意思,还能最终深入我们的大脑读取思想。

在不久的未来,语音计算将无处不在——汽车里,家具中,搅拌器,地铁票柜台等等,它们倾听我们的话语,解读我们的要求。

先进的超级计算机将藏于日常物品中,你会问你的路由器:“哎WiFi,你出什么毛病了?”或者冰箱,“给我推荐一个菜谱,把冰箱里快坏的蔬菜都用上。”甚至你还可以问房间,“我要不要加件外套?”

最棒的是,大多数人都能承受得起这些设备,而不只是那些科技达人。语音设备和键盘、鼠标不同,不需要任何训练和联系。未来,你可以使用自然语言来操控语音设备,就好像跟你的孩子、同事对话一样。

不过,不要以为触摸屏就这样消失了。我们将生活在一个遍布摄像头、触摸屏、麦克风和扬声器的世界,一切都连接在云服务商,它们会伴随我们去往各处,解读我们的意图,可能通过语言,可能通过手势,或者触摸键盘。

欢迎来到“无所不计算”的时代。

亚马逊 —— 崛起于“无屏”时代

Dotsy住在佛罗里达州棕榈滩,她不肯告诉我她的年纪。“你可以谷歌啊!”她大笑着说道,“说出这话其实让我挺害怕的。”

这位80几岁的老人活得很酷,一个月前,她开始学敲鼓,还跑到朋友家秀了一番。她总是把日程安排得很满,学习新东西。但在看东西上,Dotsy需要一点帮助。

Dotsy买了两款亚马逊产品,房间里的Dot(当作闹钟用),和门廊上搭载了Alexa语音助手的智能音箱Echo。Alexa在Dotsy的生活总起着非常重要的作用,可以在她看不清东西的时候帮她一把。“我觉得报时功能非常实用!我视力不太好,看时间对我来说是件很讨厌的事。”

因为视力下降,Dotsy没法用电脑,更别提手机。但她很喜欢问Alexa问题,或者让Alexa给她读书。

简单来说,Dotsy说,“Alexa棒呆了!”有时候,当Alexa给出她满意的答案时,Dotsy会说:“谢谢你。”Alexa回答她说,“很荣幸为您服务。”

我们看到,对于那些没有移动设备或笔记本电脑的人来说,以人工智能为基础的Echo是上网的好工具,而且它很强大。

当然,Alexa和Echo还有很大的提升空间。比方说,Dotsy还没法自己更改设置,因为需要在Alexa的应用内完成。尽管如此,亚马逊还是通过Echo表达了其对语音计算的定位:用户的私人空间。

在Alexa出现之前,谷歌和苹果就已经开发了语音助手,但都和手机绑定在一起。这也就意味着,想要使用语音助手,你就得把它从口袋里掏出来,手机没电它也就用不了,如果手机落在别的地方,那就更别提了。Echo则完全不同,它镶嵌在墙壁上,永远处于使用状态,永远在关注你,永远在倾听。而且,也不是你说什么话它都会应答的,只有在听到所谓“唤醒词语”的时候——比方说“Alexa”或“电脑”——它才会启动。当你手头上忙着自己的事情时,它也仅支持几个基本功能,比方说你切着蔬菜,叠衣服或早晨穿衣服的时候,Echo可以给你弄个播客听听,设置闹钟,开开灯或者预约出租车。

Alexa体验与Echo设备副总裁Toni Reid Thomelin表示:“现在许多个人助手使用时都存在痛点。在我们设想的未来里,痛点是不存在的。只有在科技“隐身”之后,用户才可以更多体会到生活的美好。”

Alexa的出现,给了沉睡中的科技公司一记当头棒喝。不过,亚马逊从来不肯公开Echo的销售数据(只说每天有百万用户对Alexa提出数百万问题)。最近的一份调查显示,自这款产品2014年上市以来,其销售量已经增长了一倍,预计用户达到1070万,而这当中有许多人还购买了不止一个Echo。

虽然和Siri以及谷歌助手相比,Echo所能触及的用户范围还比较小,但它正日益成为主流产品之一,并拥有一众狂热粉丝,这可是其他私人助手望尘莫及的。在亚马逊上,Echo共获得29000条评价,其中24000条对它予以肯定。

为了转型成为电商巨头,亚马逊从最初的在线书店开始,多年默默攻关语音AI技术。跟随公司近20年的Thomelin表示:“很长一段时间以内,我们会在亚马逊内部使用机器学习算法。最初的时候,我们用它来开发推荐系统,后来推荐系统大获成功之后,我们想,该怎样将这项技术用在亚马逊的其他方面呢?这时我们构思出Echo的重要一步。”

云计算技术的突飞猛进在Echo的开发中也起了至关重要的作用。Thomelin说:“大约5年前,我们内部看到云计算技术伴随AWS飞速发展,于是我们决定利用好它,并开发Echo这样的产品系列。”

不过,Echo的魔力并不在于它有多聪明,而是它非常善于倾听。哪怕在房间对角,或者电视正在播着节目,它都能听到用户的指示,其他只会说“对不起,我没听清”的语音助手则显得逊色得多。

Alexa机器学习副总裁Rohit Prasad表示,刚开始开发语音用户界面时,团队都认为这是一个遥不可及的想法。“大多数人,包括科技行业专家,都对语音识别充满怀疑,认为它没法获得较高的准确率。”

亚马逊正在迅速推进语音助手技术的研发,仅Alexa一个部门就有数千人。与此同时,该公司还大笔投资那些有意将Alexa整合进其产品的公司,比方说智能恒温器制造商Ecobee,此前亚马逊领投了该公司的一轮3500万美元融资。今年4月,Alexa语音服务副总裁Steve Rabuchin表示,团队现在的工作重点是将Alexa与其他产品进行整合,包括可穿戴设备、汽车、家用电器,以及智能家居产品。

大规模推进语音助手的开发并不让人惊讶。亚马逊确实拥有了一款为人称道的AI助手,但和谷歌、苹果甚至微软相比,亚马逊的动作已经晚了。而且,Alexa还面对着一个强有力的竞争者,也就是我们无时无刻不带在身边的——手机。

苹果 —— 优势明显

2016年末,苹果打败三星成为世界第一智能手机制造商,仅第四季度就卖出7830万台iPhone,同期三星产品销售量为7750万台。对此感到心慌的不光是三星,还有其他所有巨头。毕竟,每一台iPhone上都搭载了Siri。

2010年,苹果收购语音指令应用开发公司Siri,并在2011年的4S中得到整合。Siri首登市场,就成了使用人数最多的语音助手。

唯一的问题?Siri弱爆了。

虽然在这几年里,它的识别能力已经得到大幅提升,但是因为犯错率高,Siri从上线的第一天就被无情吐槽。

去年10月,Siri迎来5周年生日,该应用开发人Julian Lepinski指出,用户之所以无法和Siri建立“深厚的友谊”,是因为他们本身就不信任它。“苹果没有考虑到错误问答带来的严重性,用户对Siri的信心从这里就开始支离破碎了。”

目前,Siri是使用最为广泛的语音助手,支持34个国家的用户使用,有21种语言可选。谷歌助手支持7种语言,Alexa仅支持2种。但是,Siri却没有达到自己的目标。苹果透露,每周Siri会收到20亿次提问,而全球iPhone活跃用户达7亿,也就是说,用户每周只会问Siri两次问题。

不仅如此,Siri还面临着四面八方的竞争。现在,iPhone用户可以选择多款语音助手,各个红着眼想成为用户最心仪的对象。今年,亚马逊在其iPhone应用中整合了Alexa,谷歌也发布了iOS版本的谷歌助手。当然,两家公司的深入程度都还不及Siri。

与此同时,苹果也在极力扭转Siri的形象。在2016年8月的一次采访中,CEO蒂姆·库克被问到苹果在人工智能上能否追赶Facebook、谷歌和亚马逊,库克回答说:“我不赞同你的问题,你似乎暗示我们在这方面落后于其他公司。”

库克宣传说,Siri永远都陪着你,而且能够保护隐私。

在今年1月的一次电话采访中,库克强调,在推出HomeKit平台之后,Siri已经成为Echo想要成为的智能家居中心。他每天早上会对Siri说早安,让Siri打开灯,然后开始煮咖啡。

但在某些方面,Siri与Alexa还有些距离,尤其是第三方整合。2015年,亚马逊开始支持开发者定制Alexa语音功能,如今已经有超过12000项功能。苹果也在谨慎、缓慢地向开发者开放资源,希望改变Siri在人们心中的形象。

谷歌 —— 学术“领袖”

在谷歌位于加州山景城的总部办公室里,私人助手产品主管兼前Siri产品副总裁Gummi Hafsteinsson正挥舞着双手,想要表达自己的观点。

“交流不只是语音。如果我想交流,那用手就可以。”他说这,把手在空中挥了挥,“或者指着什么东西。语音是一种你来我往的信息交换,也是我们正在尝试打造的东西。”

不久之前,在一年一度的I/O开发者大会上,谷歌宣布对其助手进行两项更新,一是当你无法大声说出某项请求时,可以打字实现;二是通过Google Lens让谷歌助手“看到”这个世界。

谷歌采取的战略和苹果及亚马逊完全不同,他们希望能维持对话的持续性,也就是让用户不断和各类设备进行沟通。谷歌想做的不只是一款助手,虽然谷歌助手已经登陆1亿多台设备,但他们更想做的,是让人工智能适应你所处的所有环境。

“关键问题在于,即便在家里和车里使用起来很便利,它还是要适应其他场合的。一旦离开汽车,谷歌助手的能力立马下降,如果能全天候不分场合保证服务质量,那将是非常厉害的一件事。”

谷歌从2012年起开始开发个人智能助手(当时叫做GoogleNow)和语音搜索系统,其中后者是Hafsteinsson于2008年推出的。去年秋天,谷歌推出智能音箱Google Home,功能类似Echo,通过“OK,谷歌”或“嗨,谷歌”这样的话触发系统。

看起来,亚马逊和谷歌好像在玩一场猫捉老鼠的游戏,争夺用户起居室的控制权。今年2月,《时代》周刊报道称,亚马逊正在开发叫做“Voice ID”的语音识别功能,让Alexa能够识别不同的声音。两个月后,谷歌宣布Home将支持语音识别。本月早些时候,亚马逊推出Alexa语音和视频电话功能;一周后,谷歌紧接着也宣布Home将支持语音电话。

那么,Home和Echo之间最大的区别是什么呢?那就是,谷歌Home更智能。谷歌所掌握的海量数据和先进的机器学习技术,让Home成了目前市面上最强大的人工智能设备,准确率达到95%。机器人能够表现自然,有人的特性,根本原因就在于人工智能技术,自2001年起,谷歌已经在这方面的研究成果已经有750篇论文。

Hafsteinsson表示:“谷歌在自然语言理解、深度学习、计算机视觉和用户背景理解融合方面拥有丰富的经验,因此我们认为自己能领先其他公司一大步。我们可以理解话语背后的意图,从而更好地解决后续问题,完成复杂的多步骤任务。”

和其他私人助手不同的是,谷歌助手能够准确地理解上下文的关系。比方说如果你问,“印度总统是谁?”,然后你接着问“他的生日是哪一天?”。谷歌助手可以准确知道你说的“他”是谁,但Alexa还不知道。

还不止如此,在机器学习和神经网络技术的支撑下,谷歌助手可以教你如何用越南语说“谢谢”,如何用意大利语说“火车站在哪儿?”;在有了Lens之后,你还可以扫描日文或汉字翻译出来。这些功能Alexa和Siri都做不到。

当我们谈论亚马逊Echo,谷歌Home,苹果AirPods,或来自三星、微软、IBM、百度的机器人时,话锋常常会转移到机器人背后的人工智能技术、麦克风阵列和云服务。这是必然的,因为正是这些技术让语音计算成为现实。但从另一个角度来说,它们也只是速度和信息流的另一种形式。这些技术之所以能够成为主流,在于它们相互结合的力量;而它们的进一步发展,也让消费者能够在自己家里享受到《星际迷航》中的无敌计算机。

未来,这些助手的功能会更多,会更智能,更易理解我们的需求。它们会越来越像人,这不仅意味着它们将学会我们的语言,更意味着最终会学习到如何取代我们。今天,语音助手能控制家里的电灯,预定洗发水,非常强大,实用!但在以后,它们还会更加智能,比方说学会调制咖啡,做账、报道新闻,甚至推销保险。

去年,在Code Conference上,亚马逊CEO杰夫·贝佐斯是这样评价语音人工智能技术的,“这项技术在未来20年内给社会带来的影响,怎么形容都不为过。”

人机互动的下一次风云转变已经来临,你或许看不到它,却亲耳听到了它的影响。语音还只是第一步,更先进的技术正逐渐走来。

原文标题:苹果Siri、亚马逊Alexa、谷歌Assistant......你的“声音”为什么成为了巨头们的战场?

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:巨头  巨头词条  战场  战场词条  声音  声音词条  成为  成为词条  为什么  为什么词条