游戏行业作为互联网巨头腾讯、网易等企业的现金牛产业,连微软和索尼这样的科技巨头也纷纷布局Xbox和PlayStation游戏业务。在生成式AI技术蓬勃发展的当下,人们不禁思考:生成式AI与游戏行业的融合将如何重塑产业格局?尤其在视觉技术方面,这一结合正引发广泛关注,甚至有人预言游戏设计师和原画师将面临大规模失业。然而,也有观点认为,游戏的核心魅力在于引人入胜的剧情和互动体验,而非单纯追求图形保真度——任天堂的成功案例正是这一理念的生动证明。
Inworld作为将AI技术深度赋能游戏行业的创新企业,专注于打造沉浸式游戏角色。其核心角色引擎采用先进AI技术构建智能NPC(非玩家角色),赋予这些虚拟角色个性、思想、记忆和行动力,使其能够在游戏中实现与人类更深层次的互动。Inworld已与Unity、Unreal Engine、网易等头部游戏引擎及公司,以及GTA V、Roblox、Minecraft等知名游戏平台建立合作关系。近日,Inworld宣布获得由Lightspeed Venture Partners领投的5000万美元融资,投资方阵容堪称豪华,包括斯坦福大学、Samsung Next、Microsoft的M12基金、Eric Schmidt的First Spark Ventures,以及Meta、Disney Accelerator、Founders Fund、Kleiner Perkins等顶级机构。截至目前,Inworld累计融资额已突破1亿美元,估值高达5亿美元,正如其创始人所言,Inworld已成为AI与游戏领域资金最充裕的初创企业。
作为智能语音助手的先驱者,Inworld于2021年由Ilya Gelfenbeyn(CEO)、Kylan Gibbs(CPO)和Michael Ermolenko(CTO)共同创立。Ilya和Michael同时也是Speaktoit的联合创始人,早在2010年AI技术尚处萌芽阶段时,他们就敏锐地洞察到移动互联网的爆发式增长和语音识别技术的日趋成熟。基于这一趋势,他们开发了Android平台的个人语音助手Speaktoit,该应用一度成为Android Market上”助手类”应用中的榜首,日增用户量高达3万。尽管苹果的Siri在他们产品推出后6个月才问世,但凭借苹果强大的生态系统支持,Siri迅速崛起。面对激烈竞争,团队转型为API.AI为开发者提供服务,最终被Google收购并更名为Dialogflow AI,成为构建ChatBot的重要AI工具。离开Google后,Ilya Gelfenbeyn与团队创立了Inworld,致力于解决一个全新命题:如何构建能够吸引玩家沉浸其中的游戏世界AI角色?如何让虚拟世界中的互动体验媲美现实世界?
根据游戏行业一项覆盖千名玩家的调查,99%的受访者认为高级AI NPC将显著提升游戏体验,78%的玩家愿意为配备这类NPC的游戏投入更多时间,81%的玩家甚至愿意为此支付溢价。借助Inworld技术,开发者可以创建游戏NPC、虚拟网红、品牌代言人乃至数字人类,这些虚拟角色能够与玩家建立深度关系,解锁前所未有的互动层次。这种虚拟角色赋予”灵魂”的体验,将显著提升玩家的沉浸感,开创娱乐与营销的新纪元。
Inworld实现AI NPC的技术超越了传统大语言模型(LLM)的范畴,通过协调多个机器学习模型支持多模态角色表达,这些模型能够全面模拟人类沟通方式,包括语言和非语言行为。Lightspeed合伙人Moritz Baier-Lentz评价道:”在AI技术变革浪潮中,生成式AI公司不仅通过优化现有工具提升效率,更创造全新用户体验——Inworld正是这一理念的践行者。在众多投资机会中,Inworld凭借其独特的团队、产品速度和吸引力脱颖而出。当所有人都在追逐’新世界秩序’时,Ilya、Kylan、Michael带领团队精准捕捉到了这一巨大机遇。”
在游戏领域,玩家们已形成共识:下一代游戏的评判标准将基于体验的沉浸感。而提升沉浸感的核心在于增强角色间互动的真实性。Inworld提出,游戏角色的智能化不应局限于对话AI,而应实现多模态表达。通过协调30多个机器学习模型,其技术能够模拟人类全部沟通方式,包括声音的抑扬顿挫、面部表情和肢体语言。Inworld NPC具备学习能力、适应性、情感智慧,能够处理人际关系,拥有记忆与回忆,并自主设定目标、执行行动、遵循内在动机。
为构建这种强大的智能NPC,Inworld开发了角色生成平台,包含”角色大脑”和”上下文网格”两大核心组件。”角色大脑”负责赋予NPC多模态个性表达,而”上下文网格”则确保NPC符合游戏世界的内在逻辑,维持沉浸感。其中”角色大脑”包含四大模块:目标与行动模块通过触发器、意图识别和动机机制,驱动NPC对玩家行为的响应;长期记忆模块赋予NPC类人记忆能力,使其能够通过回忆与玩家展开深度对话;个性模块允许游戏设计师通过自然语言为NPC创建独特背景故事、动机和缺陷;情感模块则赋予NPC在互动中表达情感的能力,这些情感可映射到动画、目标和触发器中。实时语音功能支持游戏设计师配置NPC的性别、年龄、音调、语速,或通过Eleven Labs第三方服务创建定制化语音。
“上下文网格”主要提升AI虚拟角色的可控性和安全性。可配置的安全性模块根据游戏类型和安全等级,控制NPC的对话内容,过滤暴力、成人话题等敏感内容(目前仅限企业用户)。知识输入模块分为”个人知识”和”共同知识”两部分,前者控制单个角色的知识范围,后者定义多角色共享的知识体系。玩家资料模块可将玩家个性化信息与NPC结合,实现真实感十足的互动。关系模块允许配置NPC与玩家的关系类型,从朋友到敌对均可设定。而”第四面墙”功能则确保NPC的知识范围局限于其所在世界,避免因不合理对话损害沉浸感(目前仅限企业用户)。
Inworld积极与开发者社区互动,已开放部分源代码,致力于借助生成式AI技术推动整个游戏行业进步。其付费模式分为免费版、专业版和企业版:免费版提供每月200分钟API集成时间;专业版每月20美元,包含2000分钟API集成时间、无限角色创建以及Discord社区客服支持;企业版每月5000美元,无API集成时间限制,配备专属开发支持、咨询服务、高级安全功能、定制化选项、知识库和模型性能优化。
在营销领域,Inworld平台同样大放异彩。企业可利用该平台打造品牌吉祥物、数字代言人、数字销售助手等,赋予这些虚拟形象个性与”思想”,实现更高质量的互动。营销客户可定制安全功能,将品牌知识库整合进角色,并通过”第四堵墙”功能确保角色行为符合预设剧本。
AI应用创业的核心在于技术能力与场景需求的有机结合。情感、社交、故事是人类的基本需求,传统科技产品通过社交软件、兴趣社区、游戏、在线小说等满足这些需求。而AI技术如何满足这些需求?大语言模型凭借文本生成能力,使虚拟角色能够理解人类语言并讲述引人入胜的故事;视觉大模型则通过增强虚拟角色及其所处世界的真实感,提升沉浸体验。AI NPC正是将AI模型能力与具体场景需求完美结合的典范——它创造了全新体验,但并非凭空创造,而是对现有场景和应用的创新改良。对于企业而言,这种结合提升了付费意愿;对于用户而言,则提供了更易理解和感知的交互方式。
根据Inworld联合创始人Kylan Gibbs的思考,具有”智慧”的虚拟角色主要适用于三个场景:第一是元宇宙平台,如Meta Horizon、Roblox;第二是3A游戏,如GTA;第三是企业场景,涵盖品牌推广和员工培训等方向。在中国,游戏、社交、品牌领域的企业众多,市场需求持续旺盛。如何将AI能力与这些场景需求有效结合,无论对科技巨头还是创业公司,都是亟待解决的课题。