如果你来到一家只有CUI而没有GUI的餐厅,你一定会疯掉,因为你只能通过服务员慢慢地给你报菜名来知道这家餐厅有哪些菜。当然播报效率是一个问题,另外一个问题就是服务员播报完以后没有留下任何东西,剩下的就靠用户的记忆力了,所以很容易报到后面,用户已经忘了前面有啥了。 所以你会发现所有电话自动语音回复都会有一个“重新收听请按#”的选项,连一般客服点化的4、5个选项用户都记不住,更别说一份完整的菜单了。这样的例子还有很多,例如某宝的商品详情页:
(对不起,这..应该是条广告…吧..) 如果上图中的所有信息都只通过语音展示给用户,那效率肯定会比GUI低很多,因为人的阅读速度是非常高的。这里我们可以看到,其实交互可以大致分为两个部分:展示和输入。 在本文的前半部分中主要讨论了CUI如何在输入方面拥有比GUI更高的效率,但在这两个例子中,我们会发现,在绝大部分场合中,GUI的展示效率要比CUI高得多。 作为最早推出智能音响的公司,Amazon早就意识到了这个问题,并在后续的产品升级中推出了“Echo Show”这个产品。这个产品就是在原来的智能音响“Echo”的基础上加了一块显示屏,必要的时候使用显示屏来显示信息,而抛弃原来的纯语音交互模式:
初步的结论 于是我们得到了一个初步的结论: 图形界面展示效率更高 语言交互输入效率更高 展示效率不用说,无疑是GUI完胜。而输入的话,例如我们上某宝买衣服,如果我们想输入“5件S码”的话,说四个字就好了,如果用GUI进行输入,则可能需要点击“S码”,然后可能要点击四下那个“+”按钮,输入效率明显语音交互更优。 不那么初步的结论 但是,下面让我们来看一个反例:
我们可以很容易地发现,如果我是想买那个“HB+2H+2B+3B+4B+5B+6B+8B+10B+12”的话,我得说多久才能说得完这一长串文字。但是如果用GUI的话,则只需要轻轻地点击一下。当然你可以说,我们可用“买最后那个”来代指那个选项,但是如果一个超长的选项是在各大选项中间呢?或者说所有选项的名字都辣么长呢?那你就没办法了。于是我们得到了一个不那么初步的结论: 图形界面展示效率更高 语言交互固定短输入效率更高 图形界面固定长输入效率更高 GUI的尴尬 虽然说接下来我要讲GUI的尴尬,但是这其实是所有“单模态”交互的尴尬。从上文的分析中可以得出,GUI中的像素同时承担着两个任务:展示和输入。但是很多时候GUI里的展示是多余的,展示的唯一目的是为了输入,因为你不把选项展示出来,用户无法输入。让我们来看两个例子:
上图左边的展示是必要的,因为你不展示出来买家不会知道你有什么套装可以选择;但是右边的展示是非必要的,因为谁都知道一年有几个月,每个月里面有哪几天(连这个都不知道的用户暂不考虑……),可是GUI里又必须把这个展示出来,因为用户需要点击选择TA想要的东西,所以很多时候GUI里是有很多“冗余”的信息的。 讲到这里,再结合上文中提到的结论,我们就可以推导出适合进行纯语音交互的场景了:那就是选项已知且不变的适合使用纯语音交互。 这种场景还是很多的,例如编辑文章后未保存状态下返回上一级页面,页面就会弹出“文章未保存,是否确定要退出?”这样的提示,这个情况下用户会知道只有“是”和“否”两个选项,所以这里也无需做GUI的展示考虑。 有那么点意思的结论 于是我们又得到了另外一个结论: 图形界面展示长文本效率更高 语言交互固定短输入效率更高 图形界面固定长输入效率更高 选项已知且不变的适合纯语言交互 值得注意的是,上述的四条结论都是有比较严格的前提条件的,至于具体前提条件是啥,其实本文没有从逻辑上讨论得非常充分,这里就留给读者一些想象和思考的空间。 (责任编辑:admin) |