进击的人工智能：从产品角度，深度解析「对话机器人」

　　任何一款产品的出现，都是源自用户需求。要么是已经存在的存量需求，要么是正在规模化的增量需求，对话机器人也不例外。当我们在谈论“对话机器人”产品时，我们该如何看待它背后的需求呢?

　　今天，拥有对话能力的机器人，被逐渐认为是一种核心智能，是否能够流利地完成对话，可被视作这款机器人是否真正拥有智能的唯一凭证。

　　从可以追溯的历史资料来看，对话机器人(chat-bot)至少在上世纪六十年代就已经问世，经过近五六十年的发展，今天我们已经可以在许多产品中看到对话机器人的影子，微软的Cortana、小冰，苹果的Siri、Google Now、阿里小蜜、百度度秘、图灵机器人、助理来也、出门问问等等。

　　可以肯定的是：对话机器人已经成为了一种业界时尚，越来越多的公司试图通过这种全新的交互形式，来优化或者升级自己产品——我们已经可以在许多的产品中看到各种名为“小X机器人”的子产品。

　　如此多的对话机器人很容易给人一种百花齐放、方兴未艾的感觉。我们可能会隐约觉得：每家的对话机器人产品都大同小异，有些家的产品会有一些别样的特征，可是终究给人一种不属于过去十年移动互联网发展的感觉——这些对话机器人似乎都还处在很早期，用户量似乎都不大，显得都有些小众。

　　我将试图站在纯产品的视角分析：一款产品对话机器人背后，需求和产品逻辑是怎样的(文中我无意去对比各家对话机器人的优劣，也不讨论某款对话机器人的产品观或方法论)。

　　一、探索“对话”行为背后的需求

　　首先，我们试图探索“对话”这一行为的场景与背后的需求。

　　在《人类简史》一书中，认为语言能力是智人区别于其他猿类最重要的特质和能力;因为语言能力，智人可以互相通过对话而形成更丰富的交互，从而才有了协作和后来的文明。

　　人类有三种最直接的方式来使用语言：“一对零”、“一对多”、“一对一”。

　　“一对零”是自我内化的反思、总结、沉淀，不向外做交互和分享。

　　“一对多”是广播式的宣讲和相对单向的输出，譬如开大会或者发号施令。

　　“一对一”是对话——群聊也是由许多的“一对一”构成的，所以我认为不存在真正意义上的“多对多”对话。我认为对话是我们人与外界进行交互的最直接即时的途径(注意“即时”很重要)。

　　所谓对话，一定是一个双方交互行为，并且互为I/O(input / output)的过程。比如两个人对话，每个人所说的话，对于自己而言是输出，对于对方而言是输入。原则上，对话可以永远持续下去。

　　但我们几乎从未见过两个人会永远在对话，那是因为：如果需要对话持续下去，双方都需要保持参与;任何一方觉得疲劳或者无价值感了，对话就会终止。

　　对话的场景更加贴近我们的生活行为，它频次最高，且环境开放多变，分析它背后的需求并不容易。现在，我们需要回答两个问题：

　　1.1 第一个问题：对话为什么能够开始?

　　我认为人在对话中存在三个层面的需求。

　　第一层，是基础问答的需求。可以描述为：

　　我有一个问题，请你回答我。

　　二次追问的问题，属于新问题。这个过程，非常类似于我们今天所使用的搜索引擎。

　　第二层，是任务流程协作的需求，以达成某种目的为止。可以描述为：我想请你帮我买一张明天下午14:00-18:00出发，北京到上海的机票;经济舱，尽可能便宜，最好是东航的。我们和朋友相约去逛街，拜托同事帮忙预定会议室，接受闺蜜的请求明早叫她起床。

　　这些都是任务流程协作的需求。

　　第三层，是共同的情感建立，无论喜怒哀乐。聊天的目标很难定量量化，我们更多是尝试定性地去制定聊天的目标。可能是心情不好需要人陪，也可能是好事情需要向好朋友分享，我们需要对话来表达进行最直接即时的表达。

　　我并不认为只有孤独的情感才需要对话——人作为拥有万年发展历程的群居动物，与他人进行情感分享是早已刻入基因的特质。只是我们建立的情感在不同人之间会有所不同，对于信任之人的情感建立会很深刻，而对于点头之交则会保留许多。

　　开启一段对话一定源自上述的某种需求，而开启的契机则是一个相对明确的话题，哪怕只是一句“我饿了”。

　　1.2 第二个问题：对话为什么会持续?

　　对话能够持续，是有两个层面的原因。

(责任编辑：admin)