语音交互智能产品该如何做设计？这篇可能是最全面的总结了！(2)

　　根据目标客群打造其喜欢的外观造型，比如小朋友会喜欢jibo胜过Echo，追求新潮的人更喜欢raven R，因为能与之载歌载舞。与以屏幕为主的智能手机不同，用户可不能更换主题皮肤找到自己的喜好，而Google Home也只能是通过「换裤子」来迎合用户偏好与家居风格。

语音交互智能产品该如何做设计？这篇可能是最全面的总结了！

　　基于使用场景考虑造型设计

　　要考虑用户会在哪种现实环境的场景下使用，目前市面上的智能语音产品多数放置在桌面上，体积大小就要认真思考。比如大了点、重了些，就不方便自由移动随处摆放。如果定义为多个使用场景，那便携上得做到位。比如raven H顶部的「点阵触控屏」盖子，用户能轻松取下进行语音和指触交互，于是不受固定位置的限制。

语音交互智能产品该如何做设计？这篇可能是最全面的总结了！

　　避免掉进恐怖谷

　　避免与人全特征的过度相似，建议采用抽象的方法提取拟人元素进行设计表达，这有助于产品向用户传达情感信息，从而有效的提升用户好感度。例如蔚来ES8搭载的人工智能nomi，还有百度的度秘，都是通过此类设计方法打造智能情感的交互，让一个工业产品，升级成一个有生命，有情感的新伙伴。

　　但如果与人的特征过度相似，现阶段的技术能力，造型上做不到写实逼真像人。同时语音、表情、动作也无法达到自然完美的匹配，所以这不伦不类的设计会给用户带来糟心的体验。例如Blue Frog Robotics公司推出的Buddy，很容易让用户掉进「恐怖谷」。

语音交互智能产品该如何做设计？这篇可能是最全面的总结了！

　　「恐怖谷理论」是由日本机器人专家森昌弘提出，他认为，人形玩具或机器人的仿真度越高人们越有好感，但当达到一个临界点时，这种好感度会突然降低，越像人越反感恐惧，直至谷底，称之为恐怖谷。如图所示，谷底处能动的僵尸比静止的尸体更恐怖，虽然尸体已经够恐怖的了。

语音交互智能产品该如何做设计？这篇可能是最全面的总结了！

　　3. 语音的设计建议

　　自然感

　　避免单调乏味，做到像人说话一样的自然，语气上听起来积极主动，有意愿的感觉，每一个音素合成的词句清晰可辨，自然流畅。人类语音的信息含有语音声学特征和文本语义，语音声学特征主要是韵律特征(指音素组合成语句的方式)，包括声调、重音、停顿、语速等，汉语是一种有调语言，声调携带非常重要的情感信息。语音属于自然交互的一种，它需要达到「自然」的感觉，才能让用户感知可用。

　　如何让Siri听起来更像人那般自然?

　　iOS11版本关于Siri的升级目标是「让Siri听起来更像人那般自然」，实现方法是通过深度学习。每一种表达都有略微不同的声波，每一句话都包含几十或者几百个音素，Siri为每一次发声找出完美的声音组合。其中音素是由苹果挑选出的候选人进行发音采集，情感语料的获取是苹果以匿名的方式进行收听，然后用于深度学习，进行Siri的训练。

　　一旦确定「人声」不宜随意更改

　　一旦人设的声音已根植在用户的耳朵里，不宜随意更改。如果说手机界面换背景图就像人换一身新衣裳，而以语音交互为核心功能的智能产品更换「人声」，就像重新认识一位陌生人。古语说「如闻其声，如见其人」，人们会很自然的把声音与某个人进行关联，新的声音是谁，就会重新进行「人物建模」。

　　像人和人那样进行对话

　　首先是对话流畅，做到及时反馈，如有停顿，不宜过长。话术简短而有效，不要主动终止对话，尽可能的推动持续交流。当然不能以命令的形式让用户去完成某个任务，这不是一个合适的对话，它或许有点像上下级的关系，会导致用户反感和带来抵制。

　　在感知用户后尝试主动发起对话

　　再过些时日，可能Amazon Echo它能够根据说话者的语音情感进行识别计算，通过韵律学特征(语调、响度、节奏、语音质量等)更懂用户说这句话的此刻心境，就像电影《Her》里的那句台词「你今天听起来有点不开心」，它能感知你，试着主动发起一次对话。

语音交互智能产品该如何做设计？这篇可能是最全面的总结了！

　　4. 动作的设计建议

　　使用国际通用的认知动作传达，同时考虑各地方的风俗习惯

(责任编辑：admin)

搜索

热门标签:

语音交互智能产品该如何做设计？这篇可能是最全面的总结了！(2)