任何一款产品的出现,都是源自用户需求。要么是已经存在的存量需求,要么是正在规模化的增量需求,对话机器人也不例外。当我们在谈论“对话机器人”产品时,我们该如何看待它背后的需求呢?
今天,拥有对话能力的机器人,被逐渐认为是一种核心智能,是否能够流利地完成对话,可被视作这款机器人是否真正拥有智能的唯一凭证。 从可以追溯的历史资料来看,对话机器人(chat-bot)至少在上世纪六十年代就已经问世,经过近五六十年的发展,今天我们已经可以在许多产品中看到对话机器人的影子,微软的Cortana、小冰,苹果的Siri、Google Now、阿里小蜜、百度度秘、图灵机器人、助理来也、出门问问等等。 可以肯定的是:对话机器人已经成为了一种业界时尚,越来越多的公司试图通过这种全新的交互形式,来优化或者升级自己产品——我们已经可以在许多的产品中看到各种名为“小X机器人”的子产品。 如此多的对话机器人很容易给人一种百花齐放、方兴未艾的感觉。我们可能会隐约觉得:每家的对话机器人产品都大同小异,有些家的产品会有一些别样的特征,可是终究给人一种不属于过去十年移动互联网发展的感觉——这些对话机器人似乎都还处在很早期,用户量似乎都不大,显得都有些小众。 我将试图站在纯产品的视角分析:一款产品对话机器人背后,需求和产品逻辑是怎样的(文中我无意去对比各家对话机器人的优劣,也不讨论某款对话机器人的产品观或方法论)。 一、探索“对话”行为背后的需求 首先,我们试图探索“对话”这一行为的场景与背后的需求。 在《人类简史》一书中,认为语言能力是智人区别于其他猿类最重要的特质和能力;因为语言能力,智人可以互相通过对话而形成更丰富的交互,从而才有了协作和后来的文明。 人类有三种最直接的方式来使用语言:“一对零”、“一对多”、“一对一”。 “一对零”是自我内化的反思、总结、沉淀,不向外做交互和分享。 “一对多”是广播式的宣讲和相对单向的输出,譬如开大会或者发号施令。 “一对一”是对话——群聊也是由许多的“一对一”构成的,所以我认为不存在真正意义上的“多对多”对话。我认为对话是我们人与外界进行交互的最直接即时的途径(注意“即时”很重要)。 所谓对话,一定是一个双方交互行为,并且互为I/O(input / output)的过程。比如两个人对话,每个人所说的话,对于自己而言是输出,对于对方而言是输入。原则上,对话可以永远持续下去。 但我们几乎从未见过两个人会永远在对话,那是因为:如果需要对话持续下去,双方都需要保持参与;任何一方觉得疲劳或者无价值感了,对话就会终止。 对话的场景更加贴近我们的生活行为,它频次最高,且环境开放多变,分析它背后的需求并不容易。现在,我们需要回答两个问题: 1.1 第一个问题:对话为什么能够开始? 我认为人在对话中存在三个层面的需求。 第一层,是基础问答的需求。可以描述为: 我有一个问题,请你回答我。 二次追问的问题,属于新问题。这个过程,非常类似于我们今天所使用的搜索引擎。 第二层,是任务流程协作的需求,以达成某种目的为止。可以描述为:我想请你帮我买一张明天下午14:00-18:00出发,北京到上海的机票;经济舱,尽可能便宜,最好是东航的。我们和朋友相约去逛街,拜托同事帮忙预定会议室,接受闺蜜的请求明早叫她起床。 这些都是任务流程协作的需求。 第三层,是共同的情感建立,无论喜怒哀乐。聊天的目标很难定量量化,我们更多是尝试定性地去制定聊天的目标。可能是心情不好需要人陪,也可能是好事情需要向好朋友分享,我们需要对话来表达进行最直接即时的表达。 我并不认为只有孤独的情感才需要对话——人作为拥有万年发展历程的群居动物,与他人进行情感分享是早已刻入基因的特质。只是我们建立的情感在不同人之间会有所不同,对于信任之人的情感建立会很深刻,而对于点头之交则会保留许多。 开启一段对话一定源自上述的某种需求,而开启的契机则是一个相对明确的话题,哪怕只是一句“我饿了”。 1.2 第二个问题:对话为什么会持续? 对话能够持续,是有两个层面的原因。 (责任编辑:admin) |