打造优秀语音交互体验的设计建议(2)

　　举个例子：在语音交互的第二个节点 – 输入中需要用”波形高低“与”语音响度高度“相匹配来给用户正在聆听的反馈，在不同场景下波形要采取不同的设计策略：

　　车载场景：驾车时用户的视觉注意力被路况占据，这时候一方面需要引入”叮“的一声语音反馈，另一方面需要设计采取更强的视觉波形确保一瞥既得。

　　语音音箱：语音音箱的场景虽然不像驾车场景注意力被强占据，但是它是没有屏幕的，这时候一般会采取带强弱有呼吸感的灯效解决反馈的问题。

　　“无形”的语音能”附着“在各种设备上，场景也是千变万化的。在设计时要时刻记住 ”唤醒-输入-理解-回答/行动“ 的语音交互框架和每个节点的用户需求，关注用户的使用环境，和视觉/听觉注意力的占据情况，不要局限只用声音做反馈。

　　2. “唤醒”设计

　　唤醒是语音交互的第一步，听说刚发布的某国产品牌的AI音箱选了十多个唤醒词，最后才用了“小爱同学”，rokid的唤醒词”若琪“也经过了精心的设计。这充分说明了唤醒设计重要性。

　　唤醒方式可以是任务的触发动作，比如点击，按压，动作，语音，表情。目前主流的唤醒方式有以下3三种 – 实体按钮、虚拟按钮、语音唤醒，每种唤醒方式各有特点，适用于不同场景，下面我们来逐一分析一下：

%e6%96%87%e7%ab%a0%e9%85%8d%e5%9b%be-5

　　(1)实体按钮

　　优点是能提供触觉反馈，使用场景有两种：

　　当用户的视觉通道被占据时。

　　近场交互且设备没有屏幕或屏幕处于熄灭状态时，例如在熄屏状态下通过长按Home唤醒

　　(2)虚拟按钮

　　唤醒方式有两种操作方式 – 点击和长按。两种方式的本质差别有三个：与面部距离、操作成本长按大于点击、微信养成的语音输入习惯使得长按更符合用户习惯。

　　点击：面部与屏幕距离远，波形反馈可见，能更好的确认设备是否在收音，且成本较小。大多数的近场交互都可以使用。同时车载场景特别适用，试想在驾车情况下让用户长按输入语音简直就是灾难。

　　长按：离麦克距离比较近，能带来更好的收音效果。可以作为一种辅助的唤醒方式兼容。

　　(3)语音唤醒

　　在双手被占据和远距离场景下语音唤醒都是最佳的方式，在设计语音唤醒是要注意以下三个方面：唤醒词的形象设计、注意唤醒后的声音反馈、防止误触发。

　　① 醒词的形象设计

　　唤醒词的设计是机器人格的一部分。在平常的社会交往中，高雅、深邃的名字，往往会给人留下美好的印象。庸名俗字则给人一种不愉快的厌恶心理或排斥感。比如”静静”给人”文静，秀气”的感觉。“糖糖”给人“甜蜜”的感觉。

　　初期的人工智能的能力是有限的，有时会给出不尽如人意的回答。一个萌萌的有亲和力的名字能让用户有更高的宽容度。

　　同时唤醒词意象要与声音特色相一致，听觉情感是非常敏感的，想象一下如果一个萌妹子说话的声音很粗犷，或者一个壮汉声音很细你是不是觉得很不舒服。去定义唤醒词对应的感知意向，在语音合成训练时匹配这种意向。

　　② 用反馈音

　　语音唤醒一般使用在远场交互场景，这时候用户很难能通过视觉确认是否唤醒了设备，就需要给出语音反馈—- 比如“叮” 或“我在呢”等等。

　　③ 止误触发

　　在日常交流中我们每天会说很多重复的字或词，比如”你“”诶“哦”等等，在设计唤醒词时要避开这些词汇。

　　3. 对话的体验设计

　　唤醒之后的对话环节是语音体验设计的核心，我们如何打造优秀的设计体验呢?首先需要了解语音交互类产品对话的基本特点，包括：轮流说话的方式、合作式的对话、关注语言的蕴意及语境、具有线索引导、对话具有可修复性。

　　在具体对话的编写上，给大家推荐通用的Grice表达准则，可以有效提升语音对话的效果。准则包括以下4方面：

　　表达质量：陈述的是有效的事物

　　信息量：不多不少，恰到好处的语言信息含量

　　关联性：陈述与话题相关的信息

　　习惯性：简明扼要，直奔主题，避免模糊晦涩的表达

　　根据不同的使用场景对话编写也有较大差别，主要从以下两个维度入手：

　　(1)区分“任务式设计”与“闲聊式设计”

　　对话式设计主要分为两种场景：任务式对话和闲聊式对话。

　　① 任务式对话

(责任编辑：admin)