编者按:本文经微信公众号新智元(ID:AI_era)授权转载,编辑:编辑部。8月8日深夜,英伟达CEO黄仁勋在顶级计算机图形学会议SIGGRAPH上发表了震撼人心的演讲,全面展示了公司在人工智能与元宇宙领域的雄心壮志。就在此前不久,被SIGGRAPH 2023正式收录的CALM模型的正式开源,更是让游戏和动画开发行业直接驶入了AI加速的快车道。CALM模型能够自主学习人类动作,无需额外训练即可自由合成和控制虚拟角色的动作,其逼真自然的效果令人惊叹。或许整个游戏和动画产业的格局即将迎来颠覆性变革,VR场景中的人物与角色也将彻底摆脱生硬感,元宇宙的加速到来已是大势所趋!想象一下AI控制角色以蹲行姿态接近目标,当距离足够近时精准踢腿,最终又以双臂高举的方式庆祝胜利的场景,这便是CALM模型带来的无限可能。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图

具体而言,英伟达联合以色列理工学院、巴伊兰大学和西蒙菲莎大学共同研发出了一种创新的条件对抗潜模型(Conditional Adversarial Latent Models,CALM)。通过深度模仿学习,CALM成功捕捉了人类动作的复杂性与多样性,实现了对虚拟角色动作的直接控制。该方法不仅能够联合学习控制策略与动作编码器,还能对给定动作的关键特征进行精准重建,而不仅仅是简单复制。实验结果表明,CALM通过学习语义化的动作表征,能够实现对生成动作的精细控制,并为更高级的任务训练提供风格调整的强大支持。训练完成后,用户只需通过类似电脑游戏的直观界面,即可轻松操控虚拟角色。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图1

论文地址:https://arxiv.org/abs/2305.02195
项目地址:https://github.com/NVlabs/CALM

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图2

CALM模型以对抗性技能嵌入技术为基础,并借鉴了其核心代码。研究人员利用单个A100 GPU,在4096个Isaac Gym环境中进行并行训练,累计完成5亿步操作。这一突破性成果为AI在虚拟角色控制领域的应用开辟了全新路径。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图3

为了实现零样本任务解决方案,CALM模型采用了三阶段训练策略:(1)动作编码器和底层策略(解码器)的联合训练,将动作捕捉序列映射为控制模拟角色的动作;(2)利用潜空间调节训练高级策略,实现对执行动作方向的控制,同时保留所需的风格特征;(3)将前两阶段成果结合,通过简单的有限状态机解决任务,无需额外训练或精心设计奖励/终止条件。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图4

在第一阶段——底层训练中,CALM模型学习了一个编码器和一个解码器。编码器接收动作参考数据集(关节位置时间序列),将其映射到低维潜表征。解码器作为底层策略,通过与模拟器交互生成类似参考数据集的动作。这一策略能够按需产生各种行为,但不受动作方向性的影响。例如,它可以被指示行走,却无法本能控制行走方向。为评估学习到的动作表征能力,研究人员测试了在潜空间中实现动作间平滑插值的能力。初始潜表征为”冲刺”,最终为”蹲下不动”,整个过程中潜表征线性插值,角色通过语义化转换实现平稳过渡,逐渐减速并调整上半身姿态。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图5

第二阶段——方向控制,研究人员训练了一个高级任务驱动策略来选择潜变量。这些潜变量被提供给底层策略,后者据此生成所需动作。具体实现中,首先通过动作编码器获取动作潜表征,然后根据高级策略所选潜变量与代表所需风格的潜变量之间的余弦距离成比例地给予额外奖励,引导高级策略采用期望行为风格。训练完成后的方向控制器,能够精准控制角色动作形式和方向,例如”蹲下行走”、”举盾行走”和”奔跑”等复杂动作。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图6

第三阶段——推理阶段,将前两阶段训练成果(底层策略和方向控制器)结合,实现无额外训练的复杂动作组合。用户只需创建包含标准规则和指令的有限状态机(finite-state machine,FSM)。这些规则和指令决定执行何种动作,类似游戏角色控制方式。例如,FSM可构建如下动作流程:(1)转身,(2)向目标蹲行直至距离足够近,(3)踢腿攻击,(4)双臂高举庆祝。这种设计使虚拟角色控制既灵活又直观,为元宇宙应用提供了强大支持。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图7

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图8

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图9

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图10

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图11

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图12

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图13

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图14

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图15

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图16

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图17

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图18

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图19

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图20

最新快讯

2025年10月30日

01:57
2025年10月30日,美国地区用户遭遇谷歌服务大规模访问中断,DownDetector监测数据显示,当日上午大量用户反馈搜索、Gmail及云端硬盘等核心服务异常。此次故障波及范围广泛,用户报告问题集中在太平洋时间上午时段,部分用户甚至无法登录账户或访问特定功能。值得注意的是,谷歌官方尚未就此事件发布任何官方声明,引发市场广泛关注。目前技术团队已介入调查,但...
01:57
2025年10月30日,欧洲航空防务集团空客正式发布了其第三季度的财务报告,整体营收表现超出市场预期。财报显示,空客在本季度实现了178.3亿欧元的营收,较市场此前预测的174.5亿欧元高出3.8亿欧元,展现出强劲的市场竞争力。在盈利能力方面,调整后的EBIT(息税折旧摊销前利润)达到19.4亿欧元,不仅超越了市场预期的17.1亿欧元,更体现了公司卓越的运营...
00:52
2025年10月29日,全球领先的铜生产商南方铜业正式发布其未来资本支出计划,预计2026年度资本投入将达到约20亿美元。这一雄心勃勃的投资方案将重点投向产能扩张和矿山开发两大核心领域,旨在通过技术升级与资源整合,全面提升公司的生产效率与市场竞争力。 南方铜业表示,此次大规模资本投入的核心目标之一是加速实现其长期战略规划。公司明确将目标锁定在2030年代...
00:52
2025年10月30日,沙特主权财富基金PIF正式公布其未来发展战略,将集中资源打造六大核心产业生态系统。这一前瞻性计划全面覆盖旅游观光与娱乐体验、城市开发与宜居环境建设、高端制造与创新科技应用、工业物流体系现代化升级,以及清洁能源与可再生基础设施发展等关键领域。作为沙特经济转型的重要举措,该计划的核心目标在于推动经济多元化发展,逐步降低对石油产业的依赖,从...
00:52
2025年第四季度,南方铜业公司传来积极信号,预计铜产量将迎来局部性恢复。公司方面透露,通过实施精细化生产流程优化和设备维护升级方案,部分矿区的产能正逐步回升。此次产能恢复主要集中在运营条件得到显著改善的特定矿区,显示出公司对生产效率提升的坚定决心。 与此同时,南方铜业还宣布了降本增效的阶段性目标,预计现金成本将有效降低,整体运营效率得到显著提升。这一系...
00:10
2025年10月29日,通用汽车公司正式宣布了一项重大人事调整计划,将大幅裁减底特律电动车工厂的岗位数量,总计高达1200个。与此同时,位于田纳西州和俄亥俄州的电池生产工厂也将进行数百人的裁员。这一系列裁员措施主要聚焦于电动车型及电池制造部门,其核心目标在于通过优化成本结构,进一步调整和优化产能布局,以适应市场变化和公司战略需求。 通用汽车在公告中强调,对于...
00:10
北京现代全新纯电紧凑型SUV EO羿欧今日正式揭开神秘面纱,正式公布指导价11.98万元起,为消费者带来前所未有的电动出行体验。这款备受瞩目的新车不仅拥有极具吸引力的价格,更在续航能力、科技配置和设计美学上实现了全面突破,成为同级市场中不可多得的实力之选。 新车提供三种不同续航版本,充分满足不同用户的出行需求。其中CLTC标准下最长续航版本达到了惊人的722...
00:10
2025年10月28日,沙特阿美公司总裁阿明·纳赛尔在利雅得公开表示,全球能源需求正呈现持续增长态势,而这一增长趋势主要由发展中国家所推动。根据他的预测,到2026年,全球日均石油需求量预计将增加110万至140万桶。纳赛尔特别强调,尽管全球范围内能源转型正在不断推进,但发展中国家的工业化和人口增长仍然是能源消费持续上升的核心动力。这一观点深刻反映了国际能源...
00:10
2025年10月29日,一则引人注目的商业动态在汽车行业掀起波澜:备受瞩目的保时捷-皮耶希家族正积极酝酿对大众汽车旗下核心业务部门——估值高达60亿欧元的柴油发动机业务——进行战略投资。作为大众汽车的重要股东,这一潜在投资不仅彰显了该家族对传统动力技术的深厚兴趣,更凸显了其在汽车工业电动化转型浪潮中,对核心技术的坚守与布局。 据悉,此次潜在投资将聚焦于德国本...
00:10
央视财经最新报道显示,我国新能源汽车市场正经历前所未有的高速增长,今年9月渗透率已强势突破58%大关,展现出强劲的市场活力与消费潜力。在近日举办的金融街论坛年会上,新能源汽车保险议题成为行业热议焦点,引发与会嘉宾的深度探讨与广泛关注。 金融监管总局最新发布的数据进一步印证了这一趋势,今年前9个月新能源汽车商业险投保率高达91%,较传统燃油车高出6个百分点,这...

2025年10月29日

23:32
特斯拉最新发布的FSD V14版本在真实路况测试中遭遇重大挫折,其"脱手驾驶里程"表现远未达到市场预期。据汽车媒体electrek最新报道,该版本在实测中仅达到732英里,这一数据不仅远低于行业普遍期待的1000英里以上标准,更与特斯拉自身此前宣传的持续进步形成鲜明反差。部分内测车主反馈系统存在严重识别缺陷,例如将转向灯误判为停车信号的情况频发,导致车辆在路...
23:32
2025年10月29日,备受瞩目的具身智能3D数字人开放平台“魔珐星云”在北京盛大发布,正式宣告魔珐科技在虚拟人领域的重大突破。这一创新平台专为开发者量身打造,提供从3D虚拟人建模、驱动到交互的全栈式解决方案,彻底革新了数字人开发的技术生态。通过深度融合AIGC(人工智能生成内容)与具身智能技术,魔珐星云能够实现前所未有的高精度表情与动作生成,无论是细腻的面...