编者按:本文经微信公众号新智元(ID:AI_era)授权转载,编辑:编辑部。8月8日深夜,英伟达CEO黄仁勋在顶级计算机图形学会议SIGGRAPH上发表了震撼人心的演讲,全面展示了公司在人工智能与元宇宙领域的雄心壮志。就在此前不久,被SIGGRAPH 2023正式收录的CALM模型的正式开源,更是让游戏和动画开发行业直接驶入了AI加速的快车道。CALM模型能够自主学习人类动作,无需额外训练即可自由合成和控制虚拟角色的动作,其逼真自然的效果令人惊叹。或许整个游戏和动画产业的格局即将迎来颠覆性变革,VR场景中的人物与角色也将彻底摆脱生硬感,元宇宙的加速到来已是大势所趋!想象一下AI控制角色以蹲行姿态接近目标,当距离足够近时精准踢腿,最终又以双臂高举的方式庆祝胜利的场景,这便是CALM模型带来的无限可能。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图

具体而言,英伟达联合以色列理工学院、巴伊兰大学和西蒙菲莎大学共同研发出了一种创新的条件对抗潜模型(Conditional Adversarial Latent Models,CALM)。通过深度模仿学习,CALM成功捕捉了人类动作的复杂性与多样性,实现了对虚拟角色动作的直接控制。该方法不仅能够联合学习控制策略与动作编码器,还能对给定动作的关键特征进行精准重建,而不仅仅是简单复制。实验结果表明,CALM通过学习语义化的动作表征,能够实现对生成动作的精细控制,并为更高级的任务训练提供风格调整的强大支持。训练完成后,用户只需通过类似电脑游戏的直观界面,即可轻松操控虚拟角色。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图1

论文地址:https://arxiv.org/abs/2305.02195
项目地址:https://github.com/NVlabs/CALM

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图2

CALM模型以对抗性技能嵌入技术为基础,并借鉴了其核心代码。研究人员利用单个A100 GPU,在4096个Isaac Gym环境中进行并行训练,累计完成5亿步操作。这一突破性成果为AI在虚拟角色控制领域的应用开辟了全新路径。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图3

为了实现零样本任务解决方案,CALM模型采用了三阶段训练策略:(1)动作编码器和底层策略(解码器)的联合训练,将动作捕捉序列映射为控制模拟角色的动作;(2)利用潜空间调节训练高级策略,实现对执行动作方向的控制,同时保留所需的风格特征;(3)将前两阶段成果结合,通过简单的有限状态机解决任务,无需额外训练或精心设计奖励/终止条件。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图4

在第一阶段——底层训练中,CALM模型学习了一个编码器和一个解码器。编码器接收动作参考数据集(关节位置时间序列),将其映射到低维潜表征。解码器作为底层策略,通过与模拟器交互生成类似参考数据集的动作。这一策略能够按需产生各种行为,但不受动作方向性的影响。例如,它可以被指示行走,却无法本能控制行走方向。为评估学习到的动作表征能力,研究人员测试了在潜空间中实现动作间平滑插值的能力。初始潜表征为”冲刺”,最终为”蹲下不动”,整个过程中潜表征线性插值,角色通过语义化转换实现平稳过渡,逐渐减速并调整上半身姿态。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图5

第二阶段——方向控制,研究人员训练了一个高级任务驱动策略来选择潜变量。这些潜变量被提供给底层策略,后者据此生成所需动作。具体实现中,首先通过动作编码器获取动作潜表征,然后根据高级策略所选潜变量与代表所需风格的潜变量之间的余弦距离成比例地给予额外奖励,引导高级策略采用期望行为风格。训练完成后的方向控制器,能够精准控制角色动作形式和方向,例如”蹲下行走”、”举盾行走”和”奔跑”等复杂动作。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图6

第三阶段——推理阶段,将前两阶段训练成果(底层策略和方向控制器)结合,实现无额外训练的复杂动作组合。用户只需创建包含标准规则和指令的有限状态机(finite-state machine,FSM)。这些规则和指令决定执行何种动作,类似游戏角色控制方式。例如,FSM可构建如下动作流程:(1)转身,(2)向目标蹲行直至距离足够近,(3)踢腿攻击,(4)双臂高举庆祝。这种设计使虚拟角色控制既灵活又直观,为元宇宙应用提供了强大支持。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图7

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图8

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图9

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图10

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图11

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图12

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图13

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图14

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图15

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图16

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图17

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图18

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图19

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图20

最新快讯

2025年12月16日

09:14
微新创想12月15日重磅消息,长期以来手机电池容量始终徘徊在5000-6000mAh的瓶颈期,用户中度使用仅能勉强支撑一天,充电宝也因此成为许多人出门在外的必备装备。然而进入2025年,手机厂商们纷纷发力,这一行业困局被彻底打破。荣耀率先在自家的荣耀Power系列上实现了8000mAh的突破,将手机电池容量带入全新的8000mAh时代,为用户带来了前所未有的...
09:14
日本航天企业SPACE ONE即将于2025年2月25日迎来其小型火箭“KAIROS”3号机的发射任务。这一备受瞩目的航天事件定于当天上午11时准时启程,发射地点选在位于和歌山县串本町的“Space Port纪伊”发射场。此次发射不仅标志着SPACE ONE的持续努力,也承载着业界对小型卫星发射技术的热切期待。 作为一家成立于2018年的新兴航天企业,SPA...
09:14
2025年12月15日,全球电脑市场迎来重大消息,台湾两大电脑巨头宏碁与华硕正式宣布将全面上调PC产品价格。这一决定背后,是存储芯片持续缺货引发的巨大成本压力。作为全球笔记本电脑市场的领军企业,宏碁与华硕均面临供应链困境,不得不通过调整售价来缓解财务压力。 此次价格调整的核心原因在于全球存储芯片供应的严重短缺。宏碁董事长陈俊圣在内部会议上明确指出,由于上游原...
09:14
2025年12月16日,华泰证券发布了一份深度研报,揭示了全固态电池技术正迎来历史性发展机遇。报告指出,凭借其卓越的安全性表现和远超传统锂电池的能量密度优势,全固态电池正加速从实验室走向产业化应用。这一技术突破不仅将重塑新能源汽车和储能产业的格局,更标志着全球能源存储技术迈入全新纪元。 当前,全固态电池产业的发展重心已从基础材料研究转向生产工程领域。在这一关...
09:14
近日,OpenAI 首席传播官汉娜・王正式宣布,她将于明年一月告别这家科技巨头,开启人生新篇章。这一消息由 OpenAI 官方发言人凯拉・伍德确认,并引发业界广泛关注。汉娜・王在任期间,以其卓越的沟通才能为 OpenAI 塑造了积极正面的公众形象,显著提升了公司的品牌影响力与行业声誉。 OpenAI 首席执行官山姆・阿尔特曼与应用部门首席执行官菲杰・西莫联合...
09:14
Chai Discovery 作为一家专注于药物研发领域的生物科技初创企业,近日成功斩获1.3亿美元B轮融资,公司估值飙升至令人瞩目的13亿美元。此次融资由知名风投机构General Catalyst和Oak HC/FT联合领投,Menlo Ventures、OpenAI、Dimension、Thrive Capital、Neo、Yosemite Ventu...
09:14
OpenAI于12月15日正式官宣,任命前谷歌企业发展主管Albert Lee担任公司企业发展副总裁一职。Lee将于12月16日正式履新,直接向首席财务官Sarah Friar汇报工作,其核心职责将聚焦于推动OpenAI在战略合作、投资布局及商业生态拓展等关键领域实现突破性进展。 Albert Lee在谷歌任职期间长期主导企业级合作与战略投资事务,积累了丰富...
09:14
OpenAI 在其十周年庆典之际发布了备受瞩目的 GPT-5.2 模型,这一全新系列在专业领域引发了巨大反响。根据官方公布的数据,GPT-5.2 在多项权威基准测试中取得了令人瞩目的成绩,甚至在某些专业领域超越了人类专家的表现,成为迄今为止在专业应用中最出色的 AI 模型之一。OpenAI 详细介绍称,GPT-5.2 在多个技术领域实现了突破性进展。以 GD...
09:14
人工智能领域的领军企业OpenAI近日宣布了一项重要的人事任命,前谷歌高管Albert Lee将出任企业发展业务负责人一职。Lee在谷歌云和Google DeepMind的发展业务中积累了丰富的经验,并主导了多项引人注目的收购交易,其中包括今年3月以320亿美元收购云安全初创公司Wiz的里程碑式交易。这一战略任命标志着OpenAI将在战略投资和并购领域加速布...
09:14
知识共享组织(Creative Commons,CC)近期对"付费爬取"(Pay-for-Crawl)技术表达了审慎的支持态度。这一创新系统通过自动支付报酬的方式,允许机器(如人工智能网络爬虫)在访问网站内容时进行数据采集。CC今年早些时候推出的"开放人工智能生态系统"框架,旨在为控制数据的公司与利用数据进行训练的AI提供商之间,搭建共享数据集的法律和技术桥...
09:14
迪士尼首席执行官鲍勃·艾格近日向CNBC透露了公司与OpenAI签署的三年期授权合作协议的细节:尽管协议为期三年,但针对迪士尼旗下核心IP的独家授权期限仅为一年。这一合作于上周正式宣布,迪士尼将漫威、皮克斯、《星球大战》等200多个标志性角色的海量内容授权给OpenAI的Sora视频生成器使用。这意味着OpenAI在一年内将成为唯一获得合法授权的AI公司,允...
09:14
路透社最新消息显示,英伟达于本周一正式宣布完成对人工智能软件公司 SchedMD 的战略性收购。这一举措标志着英伟达在开源技术领域的又一重要布局,进一步巩固了其在全球 AI 生态系统中的领导地位。作为全球知名的图形处理器巨头,英伟达不仅以其卓越的高速芯片闻名于世,更在 AI 领域展现出惊人的战略眼光,积极构建完善的 AI 技术生态。 英伟达通过开源模式,向业...