由于人工智能技术的迅猛进展,几年之后,计算机可能自动设计游戏。 那时, 某款游戏产品的宣传卖点也许将是“本游戏100%由人类制作” 。 这个听起来有点天方夜谭的想法,或许不久之后就会实现。正在努力实现这个愿景的,是一家叫做北京深极智能科技的公司,在明年你就有可能看到他们的第一款由机器打造的的游戏。 “用机器自动制作游戏”的想法来自郭祥昊博士--深极智能公司的创始人。 郭祥昊1998年在北京邮电大学获得了自然语言处理(NLP)方向的博士学位,师从信息理论和神经网络专家钟义信教授。同时他还有一个并不寻常的身份:资深游戏制作人。 如果你是一个老游戏玩家,想必对他制作的独立游戏《北京浮生记》印象深刻。 正是这款游戏的爆红,激励他2005年从一家国企科研机构离职,转投游戏行业。这些年来,他和他带领的团队先后开发了《方便面三国》、《大明浮生记》、《找你妹2014》、《狂暴之翼》等游戏。 而在实现这一宏伟目标前,这家公司还想先用人工智能技术帮助游戏厂商提升游戏运营的质量,增加收入,用“大数据和人工智能技术能改进游戏业”。 在郭祥昊看来,游戏是数据的组合,其中的一切都是可以量化的,即使是游戏功能开放节奏、玩家疲劳度这些传统意义上较为主观、定性的概念,也可以完全用定量的方式量化出来。 2016年底离职创业前,郭祥昊带着一支科学家小队在青果灵动公司用大数据做手机网游《狂暴之翼》的游戏前期改进。这个产品的成功因素很多,而利用数据,也发挥了重要的作用 游戏中,已经被发现的问题解决起来不那么困难。最困难的是很多设计问题“我们不知道我们不知道”。游戏业经常出现某产品测试数据不佳,但由于苦于不知道具体原因, 难以下手改进的现象。策划面对这些棘手的问题时,往往会根据经验给出主观臆测判断(所谓“拍脑袋”),有较大的盲目性,改进效果很难把握,很随机。 解决办法之一就是用客观数据去发现问题。游戏开发过程中,他们对玩家在游戏前期的行为进行了细粒度埋点,得到了大量的玩家行为数据,然后应用大数据技术,用过硬的数据证据修正游戏的各种设计问题,其中包括策划和QA都没有意识到的设计问题。 大量玩家的连续点击流(ClickStream), 形成了时间序列上有意义的大数据,能够用统计学手段度量玩家的成长感、目标感、流失、疲劳度、UI易用性等。 他们还利用数据, 用支持向量机(SVM)训练出了《狂暴之翼》付费玩家预测模型,准确率达到了81%,成果发表在游资网(GameRes)上后,引起了不小反响。这坚定了郭祥昊用微观大数据来对抗游戏开发过程中的盲目性和不确定性。 2016年3月, AlphaGo战胜李世石的事件给了郭祥昊很大的震动。专业的技术背景、11年在游戏行业工作的经历,让他认识到这个行业的痛点和问题。2016年10月他从青果灵动公司离开,创办了深极智能公司,并且得到了千万级天使轮投资。而有趣的是,这家公司的名字也是利用RNN(循环神经网络)学习了《道德经》五千多字内容后,自动生成的7个名字之一。 深极智能公司的一项业务,就是通过精细埋点数据来改进游戏的前期表现,目前已经有包括上市公司在内的客户。 此外,公司还在较短时间内,用机器学习的方式研发了游戏智能客服系统,能让玩家通过人机对话的方式得到客服服务,即将用于青果灵动的《狂暴之翼》。 对于一家初创公司来说,上面两项业务可以带来持续的现金流。但这家公司还想把深度强化学习(Deep Reinforcement Learning, DRL)技术应用到游戏业中去,做一些更具有想象力的事——用深度强化学习打造游戏版的《西部世界》,甚至未来用机器自动生成游戏。 作为强化学习的研究者,郭祥昊很清楚,强化学习“自古以来”都是通过游戏展现自己的能力的。比如,1992年,美国人Gerry Tesauro用强化学习和神经网络结合,研发了能战胜人类的西洋双陆棋程序(TD-Gammon);2013年英国的Deepmind的AI系统利用深度强化学习自动玩ATARI游戏,轰动一时; 而深度强化学习是AlphaGo核心模块之一,它赋予了AlphaGo通过Self-Play来自学习的能力。 深极智能公司正在用深度强化学习打造游戏版的《西部世界》。具体来说,就是用深度强化学习模拟网络游戏玩家行为,训练出接近人类用户的虚拟玩家(Agent),这些玩家在行为方面接近人类用户,能在网游环境下通过图灵测试。 (责任编辑:admin) |