而搜索引擎的那种“关键词输入、数据库搜索、信息匹配、多次调整、返回结果”不恰恰也是完全符合贝叶斯学习原则吗?所以,我们有理由相信,搜索引擎通过构建模拟神经网络已经可以获得人类一定程度上的学习能力,例如,目前“百度大脑”已经达到2岁儿童的智力水平。美国儿科学会的《育儿百科》中将儿童称为“恐怖的2岁”,他的词汇量开始丰富;能够在心里想象出事物、行为和概念的图像;他开始理解物体之间的关系;他开始将不同的活动串联在一起形成一个逻辑关系;当他意识到社会希望他遵循某些规则后,他会开始培养起一定程度的自控能力。虽然“百度大脑”可能无法与这些智力表现形式一一匹配,但我们还是从中感觉出机器智能的巨大进步。 6、更加开放的搜索引擎平台 对于机器学习和人工智能这类研究周期长、学科跨度大的研究课题,必须保持开放的心态和积极合作的意愿。欧盟人脑计划就一直在强调开放式平台的建立、开发接口的开放和多学科的融合等等。对于搜索引擎来说,开放一直是其独特优势,其几乎可以覆盖所有的用户和行业。但机器学习和人工智能这个长期目标还需要搜索引擎保持持续开放,我们也可以从百度的“大数据引擎”战略中看出其对开放和合作的重视程度,它将大数据存储、分析和智能化处理等一整套核心能力通过平台化、接口化的方式对外开放,以吸引更多的合作方;与北京航空航天大学共同进行科学研究;与交通、金融、医疗行业的深度合作等。平台的开放不仅可以使现有的机器学习功能发挥更加广泛的价值,还能通过更多的应用和外部资源的引入来对现有的机器学习模型进行验证和完善。 三、搜索引擎过渡到人工智能的忧虑 1、个人数据隐私 我们可以对实验室中的人工智能漠不关心,因为无论它的研究进展到何种程度,都不会与我们产生直接关系。但我们对每天都在使用的搜索引擎智能化的态度则完全不同,搜索引擎人工智能化的动因是我们与其之间进行的无数次交互,我们对其智能化的定义是它能更快、更准确的帮我们找到所需信息,它之所以如此智能是因为更加了解我们的需求,而它对我们的了解是基于我们给它提供的个人信息越来越多,这当然就意味着我们的隐私越来越少。 搜索引擎知道我们的出行路线、地理位置、工作信息、日常行为模式和交际圈子,它比任何保险公司或银行都了解我们的风险状况,随着可穿戴智能设备的兴起,它也可能比医生更了解我们自身的身体状况。或者说,搜索引擎将变得比我们自己更了解自己。 这是信息时代独特的背景,对于效率的追求使我们不可避免的享受互联网搜索引擎等服务带给我们的信息服务,同时也不可避免的享受个人信息外泄的苦恼。我们观察到越来越智能化和人性化的信息服务带来的世界的改变,带给我们效率的提升,却忽视了随着我们个人信息的越发公开,我们的一举一动正在被人察觉。搜索引擎的机器学习势必需要越来越多的用户信息,这与我们的隐私权存在本质上的冲突。或许,我们已经意识到这一点,但在效率面前对此无能为力。 2、我们把记忆交给了搜索引擎 《浅薄》里提到,互联网正在塑造着我们的大脑,无时无刻不在改变着我们,而搜索引擎则首当其冲抢占了我们的记忆。几千年来,人类都依赖彼此记忆日常生活的细枝末节。现在,我们依赖的是电子设备和“云”,它们正在改变我们感知和记忆周围世界的方式。互联网不仅可能取代了“他人”这种外援式的记忆资源,也取代了我们本身的认知官能。互联网不仅消除了我们与同伴分享信息的需要,也瓦解了将即时习得的重要信息,存储进生物式记忆系统的冲动。这就是所谓的“搜索引擎效应”。 如果把我们的记忆看做数据库,我们的每次记忆存储是为了将来在某个时刻得到所需要的信息,我们的每次回忆也是在这个数据库进行一次搜索。试想一下,如果更加智能的搜索引擎对我们了如指掌,当我们通过互联网搜索信息的速度比从大脑的记忆中搜索更快、更准确时,我们当然会毫不犹豫的选择前者,全然在乎这部分“记忆”是存在于外部的互联网,还是存在于自己的大脑中。 对于这种结果的优劣依然也存在争论,一种观点认为,我们将一部分记忆分摊给搜索引擎之后,他们开始认为比以往任何人都懂得多;但事实上,对搜索引擎的依赖恰恰说明他们对周围世界的认识少之又少,我们完全将谷歌算法的产物当做了自己“知道”的东西。而另一种对立观点则认为,在我们成为“互联脑”(Inter-mind)一员的同时,会发展出一种不再依赖我们大脑中本地记忆的新型智力。当我们从记忆日常事实的需求中解放,就可以利用空余出来的这部分脑力资源,去实现个人的雄心。这种进化之中的“互联脑”,或许可以将人类个体的创造力与互联网上丰沛的知识结合在一起,使我们有能力突破一些自己制造的困境。 3、终极智力的移交 虽然意识之谜仍然未解,但至少我们已经知道,我们的意识和思考源于我们的神经连接,在神经元之间进行传递的神经递质所携带的信息构成了我们自身,就像Sebastian Seung所说“我是我的连接体”。神经科学的出现正在抹杀“灵魂”,在任何一个人中并不存在一个所谓的真正自我,我们所拥有的只有自己的大脑,这意味着我们只是大脑在特定时间中所呈现的状态而已,而这种状态完全可以通过信息来体现。当然,我们也可以像Hinton一样把大脑的神经网络看作一个运行在多层面上的软件。或者说,我们的神经活动在本质上也是一种信息传输和计算。《黑客帝国》中有段台词对此做了最为精辟的概括:“什么是真实?该怎么定义?如果真实指的是触觉、嗅觉、味觉和视觉等,这些其实都是大脑接受的信号和信息。” 当体现我们意识的各种互联网行为被搜索引擎量化、统计和重新组合时,这是否就意味着他们可以从中掌握那些原本属于我们自身的智力?它们通过机器学习模拟出我们的智力,再结合它们生来就优于人类的强大功能,甚至可以解答出人类自身永远无法企及的难题。百度的“大数据引擎”除了提到大数据和机器学习在许多重点行业的应用,还提到可以“利用机器学习重新认识外部世界,发现我们没有发现过的自然规律”。如果这种情况出现,我们人类最伟大的职业哲学家、科学家和艺术家可能都要让位于搜索引擎了。 (责任编辑:admin) |