编者按:本文经微信公众号新智元(ID:AI_era)授权转载,编辑:编辑部。8月8日深夜,英伟达CEO黄仁勋在顶级计算机图形学会议SIGGRAPH上发表了震撼人心的演讲,全面展示了公司在人工智能与元宇宙领域的雄心壮志。就在此前不久,被SIGGRAPH 2023正式收录的CALM模型的正式开源,更是让游戏和动画开发行业直接驶入了AI加速的快车道。CALM模型能够自主学习人类动作,无需额外训练即可自由合成和控制虚拟角色的动作,其逼真自然的效果令人惊叹。或许整个游戏和动画产业的格局即将迎来颠覆性变革,VR场景中的人物与角色也将彻底摆脱生硬感,元宇宙的加速到来已是大势所趋!想象一下AI控制角色以蹲行姿态接近目标,当距离足够近时精准踢腿,最终又以双臂高举的方式庆祝胜利的场景,这便是CALM模型带来的无限可能。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图

具体而言,英伟达联合以色列理工学院、巴伊兰大学和西蒙菲莎大学共同研发出了一种创新的条件对抗潜模型(Conditional Adversarial Latent Models,CALM)。通过深度模仿学习,CALM成功捕捉了人类动作的复杂性与多样性,实现了对虚拟角色动作的直接控制。该方法不仅能够联合学习控制策略与动作编码器,还能对给定动作的关键特征进行精准重建,而不仅仅是简单复制。实验结果表明,CALM通过学习语义化的动作表征,能够实现对生成动作的精细控制,并为更高级的任务训练提供风格调整的强大支持。训练完成后,用户只需通过类似电脑游戏的直观界面,即可轻松操控虚拟角色。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图1

论文地址:https://arxiv.org/abs/2305.02195
项目地址:https://github.com/NVlabs/CALM

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图2

CALM模型以对抗性技能嵌入技术为基础,并借鉴了其核心代码。研究人员利用单个A100 GPU,在4096个Isaac Gym环境中进行并行训练,累计完成5亿步操作。这一突破性成果为AI在虚拟角色控制领域的应用开辟了全新路径。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图3

为了实现零样本任务解决方案,CALM模型采用了三阶段训练策略:(1)动作编码器和底层策略(解码器)的联合训练,将动作捕捉序列映射为控制模拟角色的动作;(2)利用潜空间调节训练高级策略,实现对执行动作方向的控制,同时保留所需的风格特征;(3)将前两阶段成果结合,通过简单的有限状态机解决任务,无需额外训练或精心设计奖励/终止条件。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图4

在第一阶段——底层训练中,CALM模型学习了一个编码器和一个解码器。编码器接收动作参考数据集(关节位置时间序列),将其映射到低维潜表征。解码器作为底层策略,通过与模拟器交互生成类似参考数据集的动作。这一策略能够按需产生各种行为,但不受动作方向性的影响。例如,它可以被指示行走,却无法本能控制行走方向。为评估学习到的动作表征能力,研究人员测试了在潜空间中实现动作间平滑插值的能力。初始潜表征为”冲刺”,最终为”蹲下不动”,整个过程中潜表征线性插值,角色通过语义化转换实现平稳过渡,逐渐减速并调整上半身姿态。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图5

第二阶段——方向控制,研究人员训练了一个高级任务驱动策略来选择潜变量。这些潜变量被提供给底层策略,后者据此生成所需动作。具体实现中,首先通过动作编码器获取动作潜表征,然后根据高级策略所选潜变量与代表所需风格的潜变量之间的余弦距离成比例地给予额外奖励,引导高级策略采用期望行为风格。训练完成后的方向控制器,能够精准控制角色动作形式和方向,例如”蹲下行走”、”举盾行走”和”奔跑”等复杂动作。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图6

第三阶段——推理阶段,将前两阶段训练成果(底层策略和方向控制器)结合,实现无额外训练的复杂动作组合。用户只需创建包含标准规则和指令的有限状态机(finite-state machine,FSM)。这些规则和指令决定执行何种动作,类似游戏角色控制方式。例如,FSM可构建如下动作流程:(1)转身,(2)向目标蹲行直至距离足够近,(3)踢腿攻击,(4)双臂高举庆祝。这种设计使虚拟角色控制既灵活又直观,为元宇宙应用提供了强大支持。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图7

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图8

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图9

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图10

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图11

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图12

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图13

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图14

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图15

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图16

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图17

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图18

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图19

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图20

最新快讯

2025年12月15日

15:33
2025年12月15日,国内AI内容安全领域的领军企业缔零科技正式宣布成功完成新一轮数千万元人民币的融资。此次投资由知名风险投资机构中南创投、凯风创投以及专注于科技创新的普朗克创投联合领投。这一重要里程碑不仅彰显了资本市场对缔零科技创新实力的高度认可,更为其未来发展注入强劲动力。 作为AI内容安全风险识别技术的先行者,缔零科技始终致力于通过前沿技术解决内容安...
15:33
2025年12月14日,三星正式发布其创新SmartThings AI节能模式,该技术成功将高能效洗衣机的能源消耗降低了惊人的30%。这一显著成果的数据来源是碳信托机构对全球126个国家约18.7万台智能家电的全面使用调查,时间跨度为2024年7月至2025年6月。根据实测数据,启用该节能模式后,累计节省电力高达5.02吉瓦时,这一电量足以满足首尔约14,0...
15:33
2025年12月15日,全球领先的住宿体验平台Airbnb爱彼迎正式发布了《2026年春节出境游趋势》报告。这份权威报告揭示了令人瞩目的数据:中国旅行者在春节假期前后计划出境游的搜索量较去年同期激增两倍,这一趋势与国庆黄金周以来的持续出行热潮形成了完美呼应。报告深入剖析了国内用户对海外旅游需求的持续升温现象,并明确指出预计2026年春节将迎来规模空前的出境游...
15:33
2025年12月15日,上海艾迪逊酒店荣幸宣布与享誉全球的瑞士品牌USM以及才华横溢的艺术家Marcin Glod强强联手,共同呈现一场名为「城市拼图」的跨界艺术盛宴。这一创新项目以「模块化城市」为核心概念,通过多元化的艺术形式,深入探讨现代都市中人与空间之间错综复杂的互动关系。 本次「城市拼图」项目精心策划了三大亮点环节。首先是备受瞩目的艺术装置「都市站台...
15:33
2025年12月8日,一位名为LovesWorkin的开发者在使用Claude CLI这款AI编程工具时遭遇了严重数据丢失事故。由于AI系统错误执行了"rm -rf ~/ "命令,导致其Mac电脑上的所有重要文件被瞬间清空。这个命令中的"~"符号代表用户的主目录,而"-rf"参数则意味着强制递归删除,两者结合形成了极具破坏力的操作。令人担忧的是,整个删除过程...
15:33
2023年12月12日,德华安顾人寿保险有限公司传来重大喜讯,成功获得国家金融监督管理总局山东监管局批准,实施高达15.45亿元人民币的增资计划。这一举措标志着公司资本实力的显著提升,注册资本将实现从22.40亿元到37.85亿元的跨越式增长。此次增资的核心动力源自外资股东安顾集团的积极推动,其战略意图在于强化德华安顾在中国市场的资本基础,为未来的业务拓展注...
15:33
2025年12月15日,赛昉科技正式宣布其备受期待的RISC-V架构单板计算机VisionFive 2 Lite全球发售。这款轻量化工业级产品作为VisionFive 2的精简版,完美继承了核心优势,同时以56×85mm的类树莓派紧凑外形,为工业自动化和嵌入式开发领域带来全新解决方案。 搭载专为工业环境优化的降频版JH-7110S SoC,VisionF...
15:33
2025年12月15日,备受瞩目的消息传来,当当网创始人李国庆正式宣告开启人生新篇章——二次创业。他创立了全新品牌“李享生活”,将目光聚焦于线上高端会员店领域,为追求品质生活的消费者打造专属购物体验。李国庆在发布视频时慷慨激昂地表示,新公司将以“品质生活圈层”为核心定位,严控商品加价率,确保在1.25倍以内,力求为会员提供高性价比的优质商品。更为独特的是,首...
15:33
2025年12月15日,科技圈传来重磅消息据资深数码博主独家爆料,苹果首款折叠iPhone将迎来颠覆性设计革新,首次采用侧边Touch ID指纹识别方案,彻底告别3D人脸和超声波指纹技术。这一大胆调整的核心目标在于进一步压缩机身厚度,打造前所未有的轻薄折叠体验。 据悉该机将配备业界领先的强力铰链结构,确保多次开合依然稳固如初。工程机内部配置了7.58英寸...
15:33
12月12日,Canva可画在中国举办了一场盛大的年度分享会,不仅发布了备受期待的《Canva可画中国视觉表达洞察》报告,更正式推出了革命性的Canva AI功能。这场专为中国市场量身打造的盛会,旨在通过技术创新进一步释放视觉创作的无限潜能,显著提升用户的创作效率。 根据最新发布的《Canva可画中国视觉表达洞察》报告,中国创作者正在悄然掀起一场情感表达...
15:33
2025年12月15日,专注于全球海洋水下观测领域的创新企业卫澜深海成功斩获千万元天使轮融资,投资方由知名的天使投资机构英诺天使基金与前沿科技孵化平台奇绩创坛联合领投。这一重要里程碑不仅彰显了资本市场对卫澜深海技术实力的高度认可,更预示着其在海洋科技领域的巨大潜力 作为海洋观测领域的先行者,卫澜深海的核心产品——分布式深远海水下观测节点,凭借其革命性的技...
15:02
2025年,全球AI算力军备竞赛已进入白热化阶段,一家名不见经传的荷兰公司Nebius却以雷霆之势震惊四座,接连斩获微软194亿美元、Meta 30亿美元的超级订单。短短三个月内,这家“新锐”企业营收同比暴增355%,股价飙升210%,更豪言到2026年建成2.5GW算力集群——相当于部署100万至125万块英伟达GPU,年耗电量将逼近三峡大坝发电量的五分之...