2012年8月31日,4名亚马逊工程师提交一份专利申请文件,它最终变成了Alexa,这是一套AI系统,它可以处理世界上最大、最复杂的数据集:人类语音。 工程师只需要11个单词、一张简单的图表就可以解释它是如何运行的。一名男用户在安静的房间说:“请播放《Let It Be》,披头士的音乐。”一台小小的桌面机器回答说:“没问题,John。”然后它开始播放指定歌曲。 自此之后,面向家庭的语音AI成为亚马逊的大业务,对于竞争对手而言,它也渐渐成为重要的战略战场。谷歌、苹果、三星、微软都投入了成千上万的研究人员和业务专家,它们都想开发容易使用的设备,让我们与设备对话。 Witlingo公司开发语音App,为银行、大学、律师事务所及其它机构开发,Witlingo的CEO Ahmed Bouzid认为:“到目前为止,我们所有人必须屈从于技术,比如输入、触击、滑动。现在新用户界面却屈服于我们。” 自2014年推出以来,Alexa设备销售了几千万台。在美国语音AI设备市场,亚马逊估计占了总销量的70%,虽然竞争压力越来越大。谷歌Home也卖了几百万台,苹果与微软很快也会推出自己的产品。 最终,企业的目标是抓住3个市场机会:家庭自动化,家庭娱乐,购物。 就目前来说,亚马逊无意从制造设备的企业手中获得收入,也就是制造智能恒温器、灯泡、其它Alexa联网设备的企业。未来,我们可以想像亚马逊会与企业达成营收分成协议,或者选择其它付费方式。 在这3个市场中最小的是家庭自动化市场,每年开支超过50亿美元,去年美国的零售销售额总计约为4.9万亿美元。眼下亚马逊通过销售机器赚钱,定价介于50-230美元,最低端的Dots只要50美元,高端的Echos要230美元,上面有视频显示屏。 有些企业正在开发硬件、开发服务,这些硬件与服务兼容Alexa。例如Capital One,它向银行客户销售Alexa支付系统;多伦多Ecobee制造Alexa智能恒温器,用户只需要说几个单词就可以调高或者调低房间温度。 Ecobee CEO Stuart Lombard说:“我们的客户生活很忙碌。”现在该公司销售Alexa设备有40%的营收来自海外,Ecobee成立已经10年,Alexa设备是公司增长最快的产品线。 Stuart Lombard还说:“客户必须穿过繁忙的交通车流回到家里,他们必须喂孩子,必须给孩子换尿布,还要干其它各种事。我们让他们将事情做完,不需要用到手,他们可以用手干其它事。” 当语音遇到AI 语音AI面临很大的技术挑战,因为我们说话时并不是井然有序的,我们会干扰自己,想法会动摇,我们使用单词的方式很奇怪,还会点头,发出咕哝声,我们会假设自己的话是有意义的,实际上没有。 几千名亚马逊员工正在解决这个问题,包括西雅图、Sunnyvale、加州、剑桥、马萨诸塞的研究中心。尽管如此,亚马逊还嫌不够,最近它为1100多个Alexa职位招募员工,涉及到十多个部门,当中有215个职位提供给机器学习专家。在剑桥办公室内,Alexa首席科学家罗希特·普拉萨德(Rohit Prasad)接受了媒体采访,他解释了自己的团队为何需要这么多人。 普拉萨德说:“你提问的每一个方面都让我发笑。”沉思几秒之后,普拉萨德解释说,他在语音技术方面研究了20年,在这段漫长岁月的大多数时间里,进展缓慢让他感到沮丧。但在过去5年里巨大的机会开放了。创造一个真实高效的语音AI是一项复杂的、从未被征服的任务。 在过去的岁月里,语音科学家一直想解决一件事,理解混乱表达的意义,最开始时表达有些混乱,很难搞清表达的意思,有了机器学习这样的新方法,我们用不同的策略取得进步,最开始时匹配是不完美的,机器人从不完美着手,然后通过临时猜测不断优化。 关键在于消化大量的数据,从早期的错误中学习。Alexa与用户相处的时间越多,收集的数据也就越多,可以学习的数据也就越多,也就会变得越聪明。进步越大机会越大,这个过程需要大量的人力。 这就是普拉萨德的解释。
普拉萨德说:“让我举个例子。如果你问Alexa:‘Adele的第一张专辑是什么?’回答应该是‘19’。如果你说:‘播放它。’Alexa足够聪明,知道播放那张专辑。” (责任编辑:admin) |