编者按:本文源自微信公众号腾讯研究院(ID:cyberlawrc),作者王枢、孟靖之,经微新创想授权转载。7月13日《Science》杂志发表题为《游戏持续驱动着人工智能发展进步》的深度文章,系统阐述了游戏与人工智能的共生关系,指出“游戏为通用智能工作提供了前景广阔的应用领域,将游戏作为研究人工智能的平台,不仅推动了2000亿美元全球电子游戏产业的直接发展,更为人工智能的突破性进展奠定了坚实基础。”[1]那么,游戏与人工智能究竟如何相互促进?游戏如何引领人工智能的革新?这些变革又将如何重塑我们的生活?让我们深入探索这一跨越虚拟与现实的智能进化之旅。
协同共生:游戏与人工智能的相辅相成
纵观信息科学和计算机科学的发展历程,游戏始终是人工智能研究的核心载体。每一次人工智能领域的重大突破,几乎都离不开游戏的催化作用。厦门大学游戏哲学研究中心等权威机构从理论、硬件、应用三个维度系统论证了游戏与人工智能的共生关系[2]:游戏不仅是人工智能理论的灵感源泉,更是推动技术发展的实践场域。从1950年香农以国际象棋为样本开创人工智能研究,到塞缪尔基于国际跳棋发明强化学习算法,棋类游戏始终扮演着”AI研究的试验田”角色。这些看似简单的游戏场景,却为人工智能提供了低成本、高效率的验证平台。随着游戏产业的蓬勃发展,人工智能理论研究也迎来爆发期。1971至2015年间,全球与游戏相关的人工智能研究论文不足1000篇,但2015年AlphaGO战胜围棋冠军樊麾后,相关论文数量在7年内激增至1625篇,其中17篇登上《自然》《科学》封面[3]。
游戏推动人工智能算力基础设施的迭代升级。以芯片巨头英伟达为例,1995至2022年的营收数据显示,游戏业务不仅为英伟达积累了原始资本,更构筑了技术护城河。正是凭借在游戏显卡领域的深厚积累,英伟达成功转型为人工智能芯片领导者,目前AI训练芯片市场占有率高达95%[4]。游戏显卡中诞生的诸多技术,已转化为英伟达GPU的核心能力,广泛应用于自动驾驶、医疗、能源等多元领域。
游戏为人工智能提供了可控的训练环境与清晰的评估标准。游戏中蕴含的目标、规则和挑战机制,本质上是智能的具象化表达。当程序能够完成特定游戏时,意味着它已具备某种程度的”类人智能”。一方面,游戏场景提供了丰富的人机交互场景和稳定可控的规则体系,有效解决了人工智能科研中的场景缺失问题;另一方面,游戏规则的可量化特性,为人工智能能力评估提供了客观标尺,极大提升了技术迭代效率。当前,越来越多的科研机构和企业开始依托游戏开展人工智能创新研究。游戏人工智能研究已从最初的”创造类人智能体”(如AlphaStar、OpenAIFive等),发展到游戏内容的自动生成,进一步优化人机交互体验。2023世界人工智能大会上,多所高校联合发起”游戏人工智能高校联合研究中心”,标志着游戏与人工智能的产业融合进入新阶段。
从简单规则到复杂模拟:人类教AI学会”行走与奔跑”
在众多游戏人工智能研究方向中,智能体动作生成技术尤为典型。智能体作为能够根据内外条件做出反应的虚拟或现实客体,其动作生成技术致力于让智能体行为如真人般流畅自然。如果说计算机视觉和自然语言处理分别关注图像、文字的理解,那么动作生成技术则聚焦于人工智能的行为控制领域。这一技术发展经历了从简单规则到复杂模拟的演进过程,从有限状态机到运动匹配算法,再到基于机器学习的动作生成,通过模拟人类行为模式,智能体逐渐掌握了行走、奔跑等复杂动作。
基于规则匹配的动作生成
1. 基于状态机的动作生成
在虚拟环境中,智能体的各种动作被视为不同状态。早期开发者常使用”状态机”控制智能体行为,将不同动作根据条件组合拼接。这种方法的优点在于状态转换规则明确可定义,如行走状态可转变为跑步或跳跃。但缺点在于难以处理复杂行为交互和预见未来状态变化。由于需要手动编写节点间跳转逻辑,对于复杂系统,状态机的设计和维护将变得极为繁琐。
2. 基于运动匹配的动作生成
为解决状态机的局限性,运动匹配技术应运而生。相比需要手动拼接动作片段的状态机,运动匹配技术通过建立动作姿态数据库,根据智能体当前状态和目标状态实时选择和混合最合适的动作片段。这种方法可根据角色实时状态和环境因素实现更精细的动画控制,使智能体动作更自然流畅。然而,运动匹配技术也存在内存占用大、无法实现动作创新的局限。即便是《荒野大镖客2》这样逼真的游戏,也只是实现了”运动匹配”——马设计了数百种动作动画,但并非真正的智能,而是庞大规则和资源的堆砌。
基于机器学习的智能体动作生成
基于状态机或运动匹配的动作生成技术,本质上仍未实现真正的智能动作生成,且存在系统复杂、资源消耗大的问题。为解决这一难题,国内外学者尝试基于机器学习实现智能体动作的自动生成。美国EA公司2021年开发的HyperMotion技术,通过捕捉22名职业足球运动员870万帧动作数据,利用机器学习算法实现游戏内智能体动作的实时生成,极大提升了FIFA系列游戏的动作逼真度和响应速度[7]。
在国内,腾讯自2019年起尝试将自回归神经网络模型(ARNN)应用于智能体动作生成。ARNN作为广泛应用于时间序列数据分析的机器学习算法,若应用于动作领域,可通过大量真人动作捕捉数据训练AI模型预测动作序列帧的下一帧,最终连贯生成自然动作。2019年,天美J3工作室《逆战手游》团队联合腾讯RoboticsX实验室,基于ARNN模型开展游戏及机器人领域的交叉前沿技术——智能体动作生成技术研发。该技术以ARNN原理为基础,通过数据驱动的自适应算法,使NPC或机器人能根据玩家操作或环境变化自动生成更真实的动作、反应与表达。
腾讯逆战手游团队提出的基于ARNN的动作生成技术解决方案实现了多项突破:首先,从零构建完整工具链,涵盖动作捕捉、动画预处理、训练调优等环节,形成完整制作管线。为解决移动端应用的网络同步和性能优化问题,团队采用轨迹匹配、融合动画等技术,大幅提升效果表现并降低神经网络推理的内存开销。其次,联合腾讯RoboticsX实验室将技术应用于四足机器人,实现智能控制和决策,提升训练效率。该技术使机器人能够根据外界反应自动生成更真实的动作,经过大量模拟训练后,已掌握走、跑、跳等动作,并能完成匍匐前进、跨栏跑等复杂任务,即使遇到未知障碍也能灵巧避开并自主规划路径[8]。
从模仿到超越:游戏人工智能影响现实世界
游戏环境不仅教会了人工智能”行走与奔跑”,更使其在现实世界中展现出通用价值。《Science》杂志指出,”在游戏中取得的人工智能进展,将为开发更强大、更灵活的通用人工智能系统奠定基础。”游戏人工智能技术正在跨越虚拟边界,赋能实体经济,形成新的数字生产力。
在医疗诊断领域,游戏人工智能技术已应用于医学研究和临床实践,包括个性化筛查、诊断、预后预测等。通过模拟患者病情或手术场景,强化学习可为医疗决策提供支持,使机器人辅助手术成为可能。在教育领域,游戏人工智能技术正在重塑教学方式。一方面,可借鉴游戏AI成果开发”游戏化学习”和”基于游戏的学习”活动;另一方面,利用《我的世界》《星际争霸》等游戏环境开展教学活动,强化学习教学几乎离不开游戏环境支持[9]。
展望未来,游戏人工智能技术将逐步走出虚拟世界,赋能各行各业。我们期待这一技术能够在更多领域创造惊喜,助力人类社会的创新发展。感谢腾讯天美J3工作室多位专家在本文写作过程中提供的专业指导。
参考资料来源:
[1]Wurman P R, Stone P, Spranger M. Improving artificial intelligence with games. Science, 2023, 381(6654): 147-148.
[2]厦门大学游戏哲学研究中心等《游戏人工智能产业观察报告》
[3]中科院团队最新研究:游戏科技已成为人工智能创新发展的重要驱动力. https://tech.cnr.cn/techph/20230426/t20230426_526232049.shtml
[4]从游戏到AI加速:英伟达向左,AMD向右. https://36kr.com/p/2161239632849413
[5]Holden Daniel. Character Control with Neural Networks and Machine Learning. https://www.gdcvault.com/play/10253
[6]Holden Daniel. Character Control with Neural Networks and Machine Learning. https://www.gdcvault.com/play/10253
[7]FIFA22 Hypermotion Technology. https://www.ea.com/en-au/games/fifa/fifa-22/hypermotion
[8]腾讯机器人最新动态:跟真狗学”奔跑跳跃”. https://mp.weixin.qq.com/s/vv5DsK6zjQBAsaNFh5Pxuw
[9]厦门大学游戏哲学研究中心《游戏人工智能发展报告2023》
本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。