GUI和VUI的差异来自信息维度、信息量大小、交互方式、内容驱动、任务类型等等,今天我们一起探讨一下GUI和VUI的差异,最后重点聊一下如何将GUI转化为VUI。
今天我们深入探讨一下GUI和VUI。 GUI是60年代“人机交互”的奇才道格·恩格尔巴特提出的概念,它使计算机更容易被用户接受,自从80年代苹果推出第一款搭载GUI的电脑后,至今为止GUI一直是人机交互的代表。VUI并不是全新的概念,它的前身是IVR(Interactive Voice Response,交互式语音应答),它诞生于70年代普及于2000年。电话用户只要拨打移动运营商所指定号码,就可根据语音操作提示收听、点播或发送所需的语音信息以及参与聊天、交友等互动式服务。新一代的VUI更多指的是人通过自然语言与计算机进行交互,所以可以认为VUI是人工智能时代下的人机交互代表。 在聊GUI和VUI之前,我们先聊一下视觉和听觉,因为使用感官的不同会直接导致GUI和VUI设计的不同。 维度 如果问GUI和VUI最本质的区别是什么,我认为是传递信息的维度不同。眼睛接收的信息由时间和空间XZY轴四个维度决定;耳朵接收的信息只能由时间维度决定。 虽然耳朵能觉察声音的方向和频率,但不是决定性因素。 时间决定了接收信息的多少,它是单向的、线性的以及不能停止的。耳朵在很短时间内接收的信息是非常有限的,举一个极限的例子:假设人可以停止时间,在静止的时间内声音是无法传播的,这时候是不存在信息的;还有一个说法是在静止的时间内声音总保持在一个当前状态例如“滴~~~”,这时候声音对人类来说就是一种噪音。耳朵接收的信息只能由时间决定。 眼睛却很不一样,即使它在很短时间内也可以从空间获取大量信息。空间的信息由两个因素决定:1.动态还是静态;2.三维空间还是二维平面。在没有其他参照物的对比下,事物的静止不动可以模拟时间上的静止,这时候人是可以在静止的事物上获取信息的。时间和空间的结合决定了信息的大小,好比如花一分钟看周围的动态事物远比一年看同一个静态页面获取的信息多得多。 还有一个重要的区别,眼睛可以来回观察空间获取信息;耳朵只能单向获取信息,在没有其他功能的帮助下如果想重听前几秒的信息是不可能的。 接收信息量的对比 视觉接收的信息量远比听觉高。在知乎上有神经科学和脑科学话题的优秀回答者指出大脑每秒通过眼睛接收的信息上限为100Mbps,通过耳蜗接收的信息上限为1Mbps。简单点说,视觉接收的信息量可以达到听觉接收信息的100倍。 以上数据来自知乎问题“耳朵和眼睛哪个接收信息的速度更快?” 虽然以上结论没有官方证实,但我们可以用简单的方法进行对比。在不考虑超出理解范围外,人阅读文字的速度可以达到500~1000字每分钟,说话时语速可以达到200~300字每分钟,所以视觉阅读的文字信息可以达到听觉的2-5倍。 超出理解范围时会花时间思考,这导致了接受信息量骤降。以上两个数据来自知乎问题“普通人的阅读速度是每小时多少字?”和“为他人撰写中文演讲稿,平均每分钟多少字比较合适?” 如果将图像作为信息载体,视觉阅读的信息远超听觉的5倍。眼睛还有一个特别之处,通过扫视的方式一秒内可以看到三个不同的地方(图)。 以上数据来自《人工智能的未来》一书。 GUI和VUI的差异 维度加上视觉听觉各自的特点导致了GUI和VUI在信息展现、交互等方面的不同。以下我们讨论一下GUI和VUI的差异。 内容与数据驱动 GUI的内容主要为图形和文字;VUI的内容主要为文字,图形和文字都属于非结构化数据。目前的GUI展示的内容是由结构化数据驱动的;VUI展示的内容是由非结构化数据驱动的。 信息交互 如何理解GUI和VUI由不同的数据类型驱动?人主要通过点击和手势的方式与GUI进行交互,至于人在做什么其实计算机是不知道的,它只是将点击和手势转化为坐标和操作两种数据,再给予相应的响应事件,例如打开链接、获取数据库的信息。 人通过对话的方式与VUI进行交互,对话过程中使用的自然语言属于非结构化数据,VUI要给出正确的响应事件必须要先理解人类在说什么,更重要的是在想什么。 情境感知 (责任编辑:admin) |