语言交互场景探索（一）：关于语言交互效率的探讨(3)

　　如果你来到一家只有CUI而没有GUI的餐厅，你一定会疯掉，因为你只能通过服务员慢慢地给你报菜名来知道这家餐厅有哪些菜。当然播报效率是一个问题，另外一个问题就是服务员播报完以后没有留下任何东西，剩下的就靠用户的记忆力了，所以很容易报到后面，用户已经忘了前面有啥了。

　　所以你会发现所有电话自动语音回复都会有一个“重新收听请按#”的选项，连一般客服点化的4、5个选项用户都记不住，更别说一份完整的菜单了。这样的例子还有很多，例如某宝的商品详情页：

语言交互场景探索（一）：关于语言交互效率的探讨

　　(对不起，这..应该是条广告…吧..)

　　如果上图中的所有信息都只通过语音展示给用户，那效率肯定会比GUI低很多，因为人的阅读速度是非常高的。这里我们可以看到，其实交互可以大致分为两个部分：展示和输入。

　　在本文的前半部分中主要讨论了CUI如何在输入方面拥有比GUI更高的效率，但在这两个例子中，我们会发现，在绝大部分场合中，GUI的展示效率要比CUI高得多。

　　作为最早推出智能音响的公司，Amazon早就意识到了这个问题，并在后续的产品升级中推出了“Echo Show”这个产品。这个产品就是在原来的智能音响“Echo”的基础上加了一块显示屏，必要的时候使用显示屏来显示信息，而抛弃原来的纯语音交互模式：

语言交互场景探索（一）：关于语言交互效率的探讨

　　初步的结论

　　于是我们得到了一个初步的结论：

　　图形界面展示效率更高

　　语言交互输入效率更高

　　展示效率不用说，无疑是GUI完胜。而输入的话，例如我们上某宝买衣服，如果我们想输入“5件S码”的话，说四个字就好了，如果用GUI进行输入，则可能需要点击“S码”，然后可能要点击四下那个“+”按钮，输入效率明显语音交互更优。

　　不那么初步的结论

　　但是，下面让我们来看一个反例：

语言交互场景探索（一）：关于语言交互效率的探讨

　　我们可以很容易地发现，如果我是想买那个“HB+2H+2B+3B+4B+5B+6B+8B+10B+12”的话，我得说多久才能说得完这一长串文字。但是如果用GUI的话，则只需要轻轻地点击一下。当然你可以说，我们可用“买最后那个”来代指那个选项，但是如果一个超长的选项是在各大选项中间呢?或者说所有选项的名字都辣么长呢?那你就没办法了。于是我们得到了一个不那么初步的结论：

　　图形界面展示效率更高

　　语言交互固定短输入效率更高

　　图形界面固定长输入效率更高

　　GUI的尴尬

　　虽然说接下来我要讲GUI的尴尬，但是这其实是所有“单模态”交互的尴尬。从上文的分析中可以得出，GUI中的像素同时承担着两个任务：展示和输入。但是很多时候GUI里的展示是多余的，展示的唯一目的是为了输入，因为你不把选项展示出来，用户无法输入。让我们来看两个例子：

语言交互场景探索（一）：关于语言交互效率的探讨

　　上图左边的展示是必要的，因为你不展示出来买家不会知道你有什么套装可以选择;但是右边的展示是非必要的，因为谁都知道一年有几个月，每个月里面有哪几天(连这个都不知道的用户暂不考虑……)，可是GUI里又必须把这个展示出来，因为用户需要点击选择TA想要的东西，所以很多时候GUI里是有很多“冗余”的信息的。

　　讲到这里，再结合上文中提到的结论，我们就可以推导出适合进行纯语音交互的场景了：那就是选项已知且不变的适合使用纯语音交互。

　　这种场景还是很多的，例如编辑文章后未保存状态下返回上一级页面，页面就会弹出“文章未保存，是否确定要退出?”这样的提示，这个情况下用户会知道只有“是”和“否”两个选项，所以这里也无需做GUI的展示考虑。

　　有那么点意思的结论

　　于是我们又得到了另外一个结论：

　　图形界面展示长文本效率更高

　　语言交互固定短输入效率更高

　　图形界面固定长输入效率更高

　　选项已知且不变的适合纯语言交互

　　值得注意的是，上述的四条结论都是有比较严格的前提条件的，至于具体前提条件是啥，其实本文没有从逻辑上讨论得非常充分，这里就留给读者一些想象和思考的空间。

(责任编辑：admin)

搜索

热门标签:

语言交互场景探索（一）：关于语言交互效率的探讨(3)

热评话题