举个例子:在语音交互的第二个节点 – 输入中需要用”波形高低“与”语音响度高度“相匹配来给用户正在聆听的反馈,在不同场景下波形要采取不同的设计策略: 车载场景:驾车时用户的视觉注意力被路况占据,这时候一方面需要引入”叮“的一声语音反馈,另一方面需要设计采取更强的视觉波形确保一瞥既得。 语音音箱:语音音箱的场景虽然不像驾车场景注意力被强占据,但是它是没有屏幕的,这时候一般会采取带强弱有呼吸感的灯效解决反馈的问题。 “无形”的语音能”附着“在各种设备上,场景也是千变万化的。在设计时要时刻记住 ”唤醒-输入-理解-回答/行动“ 的语音交互框架和每个节点的用户需求,关注用户的使用环境,和视觉/听觉注意力的占据情况,不要局限只用声音做反馈。 2. “唤醒”设计 唤醒是语音交互的第一步,听说刚发布的某国产品牌的AI音箱选了十多个唤醒词,最后才用了“小爱同学”,rokid的唤醒词”若琪“也经过了精心的设计。这充分说明了唤醒设计重要性。 唤醒方式可以是任务的触发动作,比如点击,按压,动作,语音,表情。目前主流的唤醒方式有以下3三种 – 实体按钮、虚拟按钮、语音唤醒,每种唤醒方式各有特点,适用于不同场景,下面我们来逐一分析一下:
(1)实体按钮 优点是能提供触觉反馈,使用场景有两种: 当用户的视觉通道被占据时。 近场交互且设备没有屏幕或屏幕处于熄灭状态时,例如在熄屏状态下通过长按Home唤醒 (2)虚拟按钮 唤醒方式有两种操作方式 – 点击和长按。两种方式的本质差别有三个:与面部距离、操作成本长按大于点击、微信养成的语音输入习惯使得长按更符合用户习惯。 点击:面部与屏幕距离远,波形反馈可见,能更好的确认设备是否在收音,且成本较小。大多数的近场交互都可以使用。同时车载场景特别适用,试想在驾车情况下让用户长按输入语音简直就是灾难。 长按:离麦克距离比较近,能带来更好的收音效果。可以作为一种辅助的唤醒方式兼容。 (3)语音唤醒 在双手被占据和远距离场景下语音唤醒都是最佳的方式,在设计语音唤醒是要注意以下三个方面:唤醒词的形象设计、注意唤醒后的声音反馈、防止误触发。 ① 醒词的形象设计 唤醒词的设计是机器人格的一部分。在平常的社会交往中,高雅、深邃的名字,往往会给人留下美好的印象。庸名俗字则给人一种不愉快的厌恶心理或排斥感。比如”静静”给人”文静,秀气”的感觉。“糖糖”给人“甜蜜”的感觉。 初期的人工智能的能力是有限的,有时会给出不尽如人意的回答。一个萌萌的有亲和力的名字能让用户有更高的宽容度。 同时唤醒词意象要与声音特色相一致,听觉情感是非常敏感的,想象一下如果一个萌妹子说话的声音很粗犷,或者一个壮汉声音很细你是不是觉得很不舒服。去定义唤醒词对应的感知意向,在语音合成训练时匹配这种意向。 ② 用反馈音 语音唤醒一般使用在远场交互场景,这时候用户很难能通过视觉确认是否唤醒了设备,就需要给出语音反馈—- 比如“叮” 或“我在呢”等等。 ③ 止误触发 在日常交流中我们每天会说很多重复的字或词,比如”你“”诶“哦”等等,在设计唤醒词时要避开这些词汇。 3. 对话的体验设计 唤醒之后的对话环节是语音体验设计的核心,我们如何打造优秀的设计体验呢?首先需要了解语音交互类产品对话的基本特点,包括:轮流说话的方式、合作式的对话、关注语言的蕴意及语境、具有线索引导、对话具有可修复性。 在具体对话的编写上,给大家推荐通用的Grice表达准则,可以有效提升语音对话的效果。准则包括以下4方面: 表达质量:陈述的是有效的事物 信息量:不多不少,恰到好处的语言信息含量 关联性:陈述与话题相关的信息 习惯性:简明扼要,直奔主题,避免模糊晦涩的表达 根据不同的使用场景对话编写也有较大差别,主要从以下两个维度入手: (1)区分“任务式设计”与“闲聊式设计” 对话式设计主要分为两种场景:任务式对话和闲聊式对话。 ① 任务式对话 (责任编辑:admin) |