如果你在中间加入其它一些话,如果你问Alexa这张专辑是哪年发行的,卖了多少张,会怎样呢?将问题替换“播放它”这个命令,早先的Alexa处理不了。现在技术可以跟着思考前进,至少某些时候是可以的,它知道“它”指的是“19”。 这是一个重要进步,进步归功于机器学习,之前 Alxea也被无数的交换难住,机器学习可以从失败中学习经验。系统知道用户不想听什么歌曲,知道之前的对话最早在何时谈到这首音乐。 MIT口语语言系统研究团队的主管James Glass说:“人们会以何种方式要求获得一些东西,你最开始时要做出假定。然后你要收集数据,调校模型。” Glass说,这种类型的机器学习方法得到了广泛的认可,不过要让它运行需要大量数据,远不是大学研究人员轻易就能获得的。 由于Alexa的崛起,亚马逊现在可以获得大量的人机语音交互信息。2016年,Alexa引进一个庞大的数据库,里面全是歌曲歌词,有了这个数据库,当用户要求播放歌词中带‘drove my Chevy to the levee’的歌曲时,系统知道用户要的是Don McLean的歌曲《American Pie》。 普拉萨德正在推行一个新项目,这个项目的关注重点就是新方法的灵活性。具体来讲就是用户撤销最初的请求时,系统要正确识别。用户使用的“信号短语”是大不相同的。一组人说:“不,不,不。”还有一组说:“取消它。”第三组人说的话类似于“等等,实际上我想要的是……”,形式有所变化。Alexa没有必要破解每一种表达。有了大量的样本和半监督机器学习技术,系统可以为否定语音找到大量可能的标记,请求改变之后能挑选出明确的新请求。 为了让Alexa成为更好的倾听者,亚马逊AI专家首先用大量数据训练系统,让它成为更好的说话者,他们对机器合成的女性声音进行优化,让节奏更完美,这样就可以刺激用户持续使用。 如果使用的是传统方法,一般会录制大量的人类语音片段,然后依赖片段合成语音。使用这种技术可以生成更自然的声音,但是无法低语、无法讽刺、无法调整,而人类许多时候会这样说话。 为了让Alxea可以处理一切任务,既可以进行活跃的对话,也可以完成平静的朗诵,亚马逊机器学习算法采用了不同的方法,它用专业解说员的声音训练系统,这些声音有的焦急、有的充满忧虑。亚马逊旗下有一家公司Audible,它是有声读物出版商,这家公司帮了大忙。 有太多想说的东西 有些人是语音AI的热心用户,那就是无法在平板手机上轻松输入的人。Gavin Kerr是Inglis的CEO,这家公司向残疾人提供住房和服务,公司已经在8户居民的家中安装了Echo和Dot设备。 如果测试完成,Gavin Kerr希望300多位居民全能安装,这是公司的全部客户。Kerr说:“它为居民带来了难以置信的好处,他们可以过得更舒适,可以获得独立性。” Kerr与几百人合作,这些人患有硬化症或者其它日渐让人衰弱的疾病。有些人卧床不起,或者坐在轮椅上,因为很难碰到墙壁上的恒温器,他们深感苦恼。 Kerr解释说:“他们的身体难以适应温度。呆在华氏72度的房间内,前一小时可能会觉得太热了,后一小时又觉得太冷了。”因为移动能力受到限制,他们很难让自己过得舒服,如果没有全天候援助,他们会过得更困难。 稍加修改,Alexa软件可以用特定语音提供服务。有一名男子,快40岁了,他想离开长期看护机构,回到日常社区生活。Kerr回忆说:“他告诉我:‘我没有办法使用Alexa语音命令。’我问他:‘你能说什么?’然后我们就修改了软件,可以让他按自己的方式用语音控制设备。现在他如果要打开厨房灯泡会说‘Mom’,如果想打开浴室灯会说‘John’。” Inglis为自己的Echo用户提供培训,时间只有4小时,许多新用户会进一步探索。从盒子里拿出Echo,包装会告诉用户一些常见的操作指令,比如播放音乐、设置闹钟、更新购物清单。 用户可以在智能手机、平板上调用Alexa控制面板,调整设置,还可以下载新App,面板还会引导用户,看看哪种提示音能让App的工作变得更好。 每周(有时频率更高)Alexa总经理罗勃·普契尼(Rob Pulciani)都会查看统计数据,这些数据可以告诉他Alexa、Dot用户最常用的表达是怎样的。一般来说,清单中排名靠前的表达都是想获得音乐、新闻、天气信息、交通信息、游戏。今年春天,有一个请求迅速爬升,这是一个短语:“Alexa,帮我放松一下。” (责任编辑:admin) |