编者按:本文经微信公众号新智元(ID:AI_era)授权转载,编辑:编辑部。8月8日深夜,英伟达CEO黄仁勋在顶级计算机图形学会议SIGGRAPH上发表了震撼人心的演讲,全面展示了公司在人工智能与元宇宙领域的雄心壮志。就在此前不久,被SIGGRAPH 2023正式收录的CALM模型的正式开源,更是让游戏和动画开发行业直接驶入了AI加速的快车道。CALM模型能够自主学习人类动作,无需额外训练即可自由合成和控制虚拟角色的动作,其逼真自然的效果令人惊叹。或许整个游戏和动画产业的格局即将迎来颠覆性变革,VR场景中的人物与角色也将彻底摆脱生硬感,元宇宙的加速到来已是大势所趋!想象一下AI控制角色以蹲行姿态接近目标,当距离足够近时精准踢腿,最终又以双臂高举的方式庆祝胜利的场景,这便是CALM模型带来的无限可能。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图

具体而言,英伟达联合以色列理工学院、巴伊兰大学和西蒙菲莎大学共同研发出了一种创新的条件对抗潜模型(Conditional Adversarial Latent Models,CALM)。通过深度模仿学习,CALM成功捕捉了人类动作的复杂性与多样性,实现了对虚拟角色动作的直接控制。该方法不仅能够联合学习控制策略与动作编码器,还能对给定动作的关键特征进行精准重建,而不仅仅是简单复制。实验结果表明,CALM通过学习语义化的动作表征,能够实现对生成动作的精细控制,并为更高级的任务训练提供风格调整的强大支持。训练完成后,用户只需通过类似电脑游戏的直观界面,即可轻松操控虚拟角色。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图1

论文地址:https://arxiv.org/abs/2305.02195
项目地址:https://github.com/NVlabs/CALM

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图2

CALM模型以对抗性技能嵌入技术为基础,并借鉴了其核心代码。研究人员利用单个A100 GPU,在4096个Isaac Gym环境中进行并行训练,累计完成5亿步操作。这一突破性成果为AI在虚拟角色控制领域的应用开辟了全新路径。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图3

为了实现零样本任务解决方案,CALM模型采用了三阶段训练策略:(1)动作编码器和底层策略(解码器)的联合训练,将动作捕捉序列映射为控制模拟角色的动作;(2)利用潜空间调节训练高级策略,实现对执行动作方向的控制,同时保留所需的风格特征;(3)将前两阶段成果结合,通过简单的有限状态机解决任务,无需额外训练或精心设计奖励/终止条件。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图4

在第一阶段——底层训练中,CALM模型学习了一个编码器和一个解码器。编码器接收动作参考数据集(关节位置时间序列),将其映射到低维潜表征。解码器作为底层策略,通过与模拟器交互生成类似参考数据集的动作。这一策略能够按需产生各种行为,但不受动作方向性的影响。例如,它可以被指示行走,却无法本能控制行走方向。为评估学习到的动作表征能力,研究人员测试了在潜空间中实现动作间平滑插值的能力。初始潜表征为”冲刺”,最终为”蹲下不动”,整个过程中潜表征线性插值,角色通过语义化转换实现平稳过渡,逐渐减速并调整上半身姿态。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图5

第二阶段——方向控制,研究人员训练了一个高级任务驱动策略来选择潜变量。这些潜变量被提供给底层策略,后者据此生成所需动作。具体实现中,首先通过动作编码器获取动作潜表征,然后根据高级策略所选潜变量与代表所需风格的潜变量之间的余弦距离成比例地给予额外奖励,引导高级策略采用期望行为风格。训练完成后的方向控制器,能够精准控制角色动作形式和方向,例如”蹲下行走”、”举盾行走”和”奔跑”等复杂动作。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图6

第三阶段——推理阶段,将前两阶段训练成果(底层策略和方向控制器)结合,实现无额外训练的复杂动作组合。用户只需创建包含标准规则和指令的有限状态机(finite-state machine,FSM)。这些规则和指令决定执行何种动作,类似游戏角色控制方式。例如,FSM可构建如下动作流程:(1)转身,(2)向目标蹲行直至距离足够近,(3)踢腿攻击,(4)双臂高举庆祝。这种设计使虚拟角色控制既灵活又直观,为元宇宙应用提供了强大支持。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图7

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图8

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图9

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图10

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图11

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图12

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图13

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图14

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图15

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图16

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图17

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图18

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图19

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图20

最新快讯

2026年02月10日

20:03
2026年2月10日,英特尔正式发布Wi-Fi驱动更新包24.20.0,适配Windows 10 64位及Windows 11系统,对应驱动版本为24.20.0.4。该版本首次支持BE211、BE213等新一代Wi-Fi 7网卡,并确认Wi-Fi 7完整功能需Windows 11 24H2及以上系统,Windows 10下仅基础连接可用。同时,驱动停止支持...
20:03
2026年2月9日,美国加州北区法院文件显示,OpenAI因商标纠纷决定不在任何AI硬件产品中使用“io”或“IYO”名称。此举源于音频初创公司iyO发起的侵权诉讼。公司副总裁Peter Welinder确认,首款无屏桌面AI硬件将不早于2027年2月28日面向消费者发货,目前仍处原型阶段,尚未启动包装与营销材料制作。该设备拟协同手机、笔记本使用,原计划2...
20:03
2026年1月30日,摩尔线程宣布开源TileLang-MUSA项目,今日再次发布。该项目实现对高层张量分块编程语言TileLang的完整支持,已在MTT S5000、S4000等国产GPU上完成验证。TileLang采用类Python声明式语法,支持自动循环优化与内存调度,降低AI算子开发门槛。实测显示,代码量减少约90%,矩阵运算性能达手工优化版本的9...
20:03
2026年2月3日,韩国媒体报道,Nexon已与暴雪达成合作,启动基于《星际争霸》IP的新游戏项目。该项目由Nexon射击事业本部主导,拟采用FPS或TPS玩法,而非传统RTS。团队已于去年底组建并完成核心人才招募。游戏设定仍沿用克普鲁星区三大种族世界观。目前处于原型开发与商业评估早期阶段,官方未予确认。此举或意在拓展Nexon全球射击品类布局。
20:03
微新创想:2026年2月6日,户外品牌KOLON SPORT可隆在北京华贸购物中心正式启用品牌体验旗舰店“KOLON ATLAS可隆自然典集”。这一全新门店由品牌自主打造,致力于通过沉浸式空间展现自然探索的核心理念。店内不仅展示了可隆最新的产品系列,还融入了丰富的文化互动元素和生活方式体验,为顾客带来全方位的感官享受。 旗舰店选址于北京核心商业区,精准定位都...
20:03
微新创想:2026年2月10日,阿里云宣布通过ICANN全面技术评估,成为中国首家具备顶级域名全链路服务能力的云服务商 阿里云此次通过评估,标志着其在顶级域名服务领域达到了国际领先水平。该认证覆盖了新顶级域名申请、域名资产管理、DNS解析、安全防护以及云部署等多个关键环节,为用户提供了一站式的解决方案 此前,企业在申请地域性顶级域名时往往需要与多个机构进行协...
19:02
微新创想:2026年2月10日,国际DRAM现货市场整体持稳,DDR5部分颗粒结束连续数日小幅下跌,出现温和反弹。市场情绪有所回暖,显示出一定的复苏迹象。 DDR5 16Gb(2Gx8)4800/5600规格颗粒价格上涨0.41%,均价达到38美元。这一涨幅虽然不大,但标志着市场开始对近期的供需变化做出反应。 同容量的eTT版本颗粒也出现了上涨,涨幅为0.5...
19:02
微新创想:2026年2月10日,制造商Musnap在海外正式推出Ocean C彩色墨水屏电纸书。这款设备采用了7英寸的Kaleido 3面板,具备300PPI的黑白显示和150PPI的彩色显示,为用户带来更清晰细腻的阅读体验。其硬件配置也相当扎实,搭载了8核处理器、4GB RAM以及64GB存储空间,能够流畅运行安卓14系统。 微新创想:Ocean C不仅在...
19:02
微新创想:2026年2月10日,四川资阳乐至县太平2号特大桥现场传来喜讯,中铁十九局成功完成最后一孔箱梁的架设工作,标志着成渝中线高铁四川段桥梁工程全面竣工。这一重要节点的达成,不仅为后续的铺轨作业和联调联试提供了坚实基础,也意味着整个项目正式迈入全面冲刺阶段。 此次桥梁工程由长江沿岸铁路集团四川有限公司负责建设管理,覆盖四川境内的全线桥梁结构。作为成渝中线...
19:02
微新创想:2026年2月10日,上海召开年度市重大工程建设工作会议。全市共安排重大工程正式项目184项、预备项目14项,计划新开工16项、基本建成22项,年度投资2550亿元,创历史新高。此次会议标志着上海在推动城市高质量发展方面迈出了坚实一步。 微新创想:项目聚焦“五个中心”建设,涵盖科技创新、产业升级、基础设施完善、文化教育提升、医疗卫生优化、生态环境改...
19:02
微新创想:2026年2月10日 大位科技发布异动公告回应市场误读 大位科技(600589.SH)在2026年2月10日发布公告 明确回应市场对其算力租赁概念的误解 公司股票在2026年2月6日、9日、10日连续三日涨幅偏离值超过20% 引起投资者广泛关注 面对市场对算力租赁业务的猜测 公司在公告中强调其相关业务收入占比并不高 2024年前三季度 大位科技的算...
19:02
微新创想:2026年2月10日,由世茂集团商业地产商娱公司与章丘控股集团联合打造的章丘世茂广场在济南市章丘区东部核心板块正式开业。项目总建筑面积约14万平方米,定位为区域旗舰级城市综合体,涵盖商业零售、休闲娱乐、餐饮及服务等多种业态。选址依托高阶居住人群集聚区,旨在提升东部片区商业能级与消费体验。该项目是目前章丘规模最大的城市综合体,标志着区域商业升级迈出关...