编者按:本文经微信公众号新智元(ID:AI_era)授权转载,编辑:编辑部。8月8日深夜,英伟达CEO黄仁勋在顶级计算机图形学会议SIGGRAPH上发表了震撼人心的演讲,全面展示了公司在人工智能与元宇宙领域的雄心壮志。就在此前不久,被SIGGRAPH 2023正式收录的CALM模型的正式开源,更是让游戏和动画开发行业直接驶入了AI加速的快车道。CALM模型能够自主学习人类动作,无需额外训练即可自由合成和控制虚拟角色的动作,其逼真自然的效果令人惊叹。或许整个游戏和动画产业的格局即将迎来颠覆性变革,VR场景中的人物与角色也将彻底摆脱生硬感,元宇宙的加速到来已是大势所趋!想象一下AI控制角色以蹲行姿态接近目标,当距离足够近时精准踢腿,最终又以双臂高举的方式庆祝胜利的场景,这便是CALM模型带来的无限可能。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图

具体而言,英伟达联合以色列理工学院、巴伊兰大学和西蒙菲莎大学共同研发出了一种创新的条件对抗潜模型(Conditional Adversarial Latent Models,CALM)。通过深度模仿学习,CALM成功捕捉了人类动作的复杂性与多样性,实现了对虚拟角色动作的直接控制。该方法不仅能够联合学习控制策略与动作编码器,还能对给定动作的关键特征进行精准重建,而不仅仅是简单复制。实验结果表明,CALM通过学习语义化的动作表征,能够实现对生成动作的精细控制,并为更高级的任务训练提供风格调整的强大支持。训练完成后,用户只需通过类似电脑游戏的直观界面,即可轻松操控虚拟角色。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图1

论文地址:https://arxiv.org/abs/2305.02195
项目地址:https://github.com/NVlabs/CALM

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图2

CALM模型以对抗性技能嵌入技术为基础,并借鉴了其核心代码。研究人员利用单个A100 GPU,在4096个Isaac Gym环境中进行并行训练,累计完成5亿步操作。这一突破性成果为AI在虚拟角色控制领域的应用开辟了全新路径。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图3

为了实现零样本任务解决方案,CALM模型采用了三阶段训练策略:(1)动作编码器和底层策略(解码器)的联合训练,将动作捕捉序列映射为控制模拟角色的动作;(2)利用潜空间调节训练高级策略,实现对执行动作方向的控制,同时保留所需的风格特征;(3)将前两阶段成果结合,通过简单的有限状态机解决任务,无需额外训练或精心设计奖励/终止条件。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图4

在第一阶段——底层训练中,CALM模型学习了一个编码器和一个解码器。编码器接收动作参考数据集(关节位置时间序列),将其映射到低维潜表征。解码器作为底层策略,通过与模拟器交互生成类似参考数据集的动作。这一策略能够按需产生各种行为,但不受动作方向性的影响。例如,它可以被指示行走,却无法本能控制行走方向。为评估学习到的动作表征能力,研究人员测试了在潜空间中实现动作间平滑插值的能力。初始潜表征为”冲刺”,最终为”蹲下不动”,整个过程中潜表征线性插值,角色通过语义化转换实现平稳过渡,逐渐减速并调整上半身姿态。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图5

第二阶段——方向控制,研究人员训练了一个高级任务驱动策略来选择潜变量。这些潜变量被提供给底层策略,后者据此生成所需动作。具体实现中,首先通过动作编码器获取动作潜表征,然后根据高级策略所选潜变量与代表所需风格的潜变量之间的余弦距离成比例地给予额外奖励,引导高级策略采用期望行为风格。训练完成后的方向控制器,能够精准控制角色动作形式和方向,例如”蹲下行走”、”举盾行走”和”奔跑”等复杂动作。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图6

第三阶段——推理阶段,将前两阶段训练成果(底层策略和方向控制器)结合,实现无额外训练的复杂动作组合。用户只需创建包含标准规则和指令的有限状态机(finite-state machine,FSM)。这些规则和指令决定执行何种动作,类似游戏角色控制方式。例如,FSM可构建如下动作流程:(1)转身,(2)向目标蹲行直至距离足够近,(3)踢腿攻击,(4)双臂高举庆祝。这种设计使虚拟角色控制既灵活又直观,为元宇宙应用提供了强大支持。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图7

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图8

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图9

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图10

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图11

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图12

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图13

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图14

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图15

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图16

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图17

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图18

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图19

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图20

最新快讯

2025年10月30日

13:47
2025年10月28日,浙江温州的王女士带着确诊白斑病的孩子前往医院接受紫光灯治疗。当紫光照射到孩子皮肤时,一个令人意外的现象出现了——不仅孩子的皮肤,连王女士和家人的衣物都发出了幽幽的蓝光。这一奇特的荧光反应迅速在网络上引发热议,成为人们津津乐道的话题。 经过仔细排查,王女士发现荧光的真正源头竟然是家中正在使用的洗衣粉。她惊喜地发现,洗衣粉包装袋内侧以及洗...
13:47
广州白云国际机场迎来历史性时刻,T3航站楼与第五跑道正式同步启用,标志着这座现代化航空枢纽迈入全新发展阶段。这项历时五年、总投资高达537.7亿元的三期扩建工程圆满竣工,使机场整体规模实现跨越式提升,正式进入"五条跑道+三座航站楼+两座塔台"的立体化运营新阶段。 新建的T3航站楼以"湾区之翼"为设计精髓,将岭南文化特色巧妙融入现代建筑语言中。其首创的开放式观...
13:47
近日,数字化营销服务商盈天地宣布成功完成A+轮融资,携手上海松江国投、九亭镇及红瓦绿合三大机构联合投资,总金额突破数千万元人民币。作为深耕金融行业Martech领域的科技企业,盈天地始终致力于推动互联网与金融应用的深度融合,为金融机构量身定制涵盖数字化转型战略规划、科技平台搭建、数据策略制定及营销运营优化等全链条服务解决方案。 此次融资的落地将为盈天地注入强...
13:47
胡润研究院正式发布《2025胡润女企业家榜》,榜单揭晓了全球范围内最具影响力的女性企业家群体。64岁的翰森制药董事长钟慧娟凭借1410亿元财富强势登顶,首次问鼎中国女首富宝座。这一惊人成就的背后,是她在创新药研发领域的持续突破,产品放量带来的市场红利,以及国际合作战略的稳步推进。据测算,钟慧娟的财富较去年近乎实现翻倍增长,彰显了医药健康产业在新时代的巨大潜力...
13:47
2025年10月30日,安纳达发布重要公告,宣布董事长刘军昌因个人工作安排调整,正式申请辞去公司董事长、非独立董事及董事会下设各委员会的全部职务。根据公司章程规定,刘军昌的辞职将在新一届董事长选举产生后正式生效。为确保公司治理体系的平稳过渡,刘军昌在卸任期间将继续履行职责,全面负责公司日常运营,直至交接工作完成。 为保障公司治理的连续性和专业性,安纳达已...
13:47
近日,专注于塑料PET酶法再生与商业化应用的生物科技企业源天生物正式宣布,成功获得丰田通商(上海)有限公司的战略投资。这一重要融资动作,与今年9月天创股本的投资共同构成了源天生物连续的资本运作,截至目前,公司累计融资已达到数千万元人民币。作为一家致力于推动环保再生材料发展的创新企业,源天生物凭借其在酶蛋白定向改造、新型固定化酶技术及生物催化工艺强化等核心技术...
13:47
彭博社最新报道披露,埃隆·马斯克的律师团队已正式宣布将全力推进对OpenAI的法律诉讼程序。律师团队强烈谴责加州与特拉华州总检察长未能有效阻止该机构以营利公司形式完成重组,强调任何试图掩盖违法行为的仓促协议都是不可接受的。首席律师托贝罗夫在声明中明确指出,必须确保OpenAI的重组过程完全符合法律法规,任何违规操作都将面临严肃追责。 近日OpenAI突然宣布...
13:16
亚马逊游戏部门迎来重大战略转型,尔湾与圣地亚哥两大办公室及核心发行团队将面临"结构性岗位调整"。这一决定意味着亚马逊将大幅缩减对高预算MMO项目的资金投入,正式开启其在线游戏开发领域的逐步收缩进程。值得注意的是,《新世界》曾创下超90万同时在线的辉煌纪录,但公司最新公告明确指出,即将推出的内容更新将是该游戏的最终篇章,服务器服务将持续至2026年。 亚马逊游...
12:43
卓润生物近日传来振奋人心的消息,成功完成A轮融资,由深创投独家领投。作为一家深耕生物医药体外诊断(IVD)与食品安全检测领域的创新企业,卓润生物凭借其卓越的技术实力和前瞻性的市场布局,在资本市场上备受瞩目。 该公司以化学发光、荧光免疫、胶体金和微流控四大核心技术平台为基石,构建了完善的体外诊断产品体系。其产品线覆盖了心脏标志物、甲状腺功能、内分泌激素、自身免...
12:43
一影医疗近日成功完成新一轮战略融资,由知名投资机构巨石创投领投。作为国内领先的医疗三维成像设备研发企业,一影医疗凭借其创新技术实力,已成功推出国内首款专为骨科手术设计的3D平板小C设备——3D C-arm。该设备不仅完整继承了传统C形臂设备灵活移动、操作便捷的核心优势,更突破性地集成了多角度3D成像技术,实现了术中实时三维影像重建功能。这一创新技术能够与骨科...
12:43
科技媒体NeoWin最新报道,OpenAI正式发布了备受期待的gpt-oss-safeguard-120b和gpt-oss-safeguard-20b两款开源模型,这标志着继今年gpt-oss系列成功推出后的又一重大开源里程碑。这两款新模型均采用行业通用的Apache 2.0许可证,为全球开发者提供了完全免费的使用和修改权限,极大地降低了AI应用的技术门槛。...
12:43
2025年10月30日,杭州见证了中国东方教育与支付宝的里程碑式合作签约仪式。双方正式达成全面战略合作协议,将充分发挥各自优势,深度整合资源,将支付宝领先的智能技术与中国东方教育成熟的职业培训体系有机结合,共同打造一个功能强大、服务高效的线上信息与服务平台。这一创新合作模式不仅标志着职业教育领域的一次重要突破,更预示着行业数字化转型进入全新阶段。通过技术赋能...