编者按:本文经微信公众号新智元(ID:AI_era)授权转载,编辑:编辑部。8月8日深夜,英伟达CEO黄仁勋在顶级计算机图形学会议SIGGRAPH上发表了震撼人心的演讲,全面展示了公司在人工智能与元宇宙领域的雄心壮志。就在此前不久,被SIGGRAPH 2023正式收录的CALM模型的正式开源,更是让游戏和动画开发行业直接驶入了AI加速的快车道。CALM模型能够自主学习人类动作,无需额外训练即可自由合成和控制虚拟角色的动作,其逼真自然的效果令人惊叹。或许整个游戏和动画产业的格局即将迎来颠覆性变革,VR场景中的人物与角色也将彻底摆脱生硬感,元宇宙的加速到来已是大势所趋!想象一下AI控制角色以蹲行姿态接近目标,当距离足够近时精准踢腿,最终又以双臂高举的方式庆祝胜利的场景,这便是CALM模型带来的无限可能。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图

具体而言,英伟达联合以色列理工学院、巴伊兰大学和西蒙菲莎大学共同研发出了一种创新的条件对抗潜模型(Conditional Adversarial Latent Models,CALM)。通过深度模仿学习,CALM成功捕捉了人类动作的复杂性与多样性,实现了对虚拟角色动作的直接控制。该方法不仅能够联合学习控制策略与动作编码器,还能对给定动作的关键特征进行精准重建,而不仅仅是简单复制。实验结果表明,CALM通过学习语义化的动作表征,能够实现对生成动作的精细控制,并为更高级的任务训练提供风格调整的强大支持。训练完成后,用户只需通过类似电脑游戏的直观界面,即可轻松操控虚拟角色。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图1

论文地址:https://arxiv.org/abs/2305.02195
项目地址:https://github.com/NVlabs/CALM

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图2

CALM模型以对抗性技能嵌入技术为基础,并借鉴了其核心代码。研究人员利用单个A100 GPU,在4096个Isaac Gym环境中进行并行训练,累计完成5亿步操作。这一突破性成果为AI在虚拟角色控制领域的应用开辟了全新路径。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图3

为了实现零样本任务解决方案,CALM模型采用了三阶段训练策略:(1)动作编码器和底层策略(解码器)的联合训练,将动作捕捉序列映射为控制模拟角色的动作;(2)利用潜空间调节训练高级策略,实现对执行动作方向的控制,同时保留所需的风格特征;(3)将前两阶段成果结合,通过简单的有限状态机解决任务,无需额外训练或精心设计奖励/终止条件。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图4

在第一阶段——底层训练中,CALM模型学习了一个编码器和一个解码器。编码器接收动作参考数据集(关节位置时间序列),将其映射到低维潜表征。解码器作为底层策略,通过与模拟器交互生成类似参考数据集的动作。这一策略能够按需产生各种行为,但不受动作方向性的影响。例如,它可以被指示行走,却无法本能控制行走方向。为评估学习到的动作表征能力,研究人员测试了在潜空间中实现动作间平滑插值的能力。初始潜表征为”冲刺”,最终为”蹲下不动”,整个过程中潜表征线性插值,角色通过语义化转换实现平稳过渡,逐渐减速并调整上半身姿态。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图5

第二阶段——方向控制,研究人员训练了一个高级任务驱动策略来选择潜变量。这些潜变量被提供给底层策略,后者据此生成所需动作。具体实现中,首先通过动作编码器获取动作潜表征,然后根据高级策略所选潜变量与代表所需风格的潜变量之间的余弦距离成比例地给予额外奖励,引导高级策略采用期望行为风格。训练完成后的方向控制器,能够精准控制角色动作形式和方向,例如”蹲下行走”、”举盾行走”和”奔跑”等复杂动作。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图6

第三阶段——推理阶段,将前两阶段训练成果(底层策略和方向控制器)结合,实现无额外训练的复杂动作组合。用户只需创建包含标准规则和指令的有限状态机(finite-state machine,FSM)。这些规则和指令决定执行何种动作,类似游戏角色控制方式。例如,FSM可构建如下动作流程:(1)转身,(2)向目标蹲行直至距离足够近,(3)踢腿攻击,(4)双臂高举庆祝。这种设计使虚拟角色控制既灵活又直观,为元宇宙应用提供了强大支持。

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图7

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图8

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图9

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图10

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图11

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图12

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图13

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图14

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图15

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图16

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图17

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图18

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图19

英伟达开源CALM模型:单张A100训练50亿步,虚拟角色零样本生成超逼真插图20

最新快讯

2025年08月06日

08:29
近日,丹麦奥尔堡动物园在社交平台上发布的一项特殊倡议引发了全球网友的强烈谴责。该动物园公开呼吁民众捐赠宠物作为园内肉食动物的饲料,声称此举旨在"模拟自然食物链并践行动物福利理念",然而这一行为因涉及严重的伦理争议迅速演变为一场国际公共事件。 据园方发布的声明显示,他们接受捐赠的宠物包括豚鼠、兔子和鸡等小型动物,并承诺所有捐赠动物将由专业人员实施"人道安乐死"...
08:29
近日,社交平台上涌现出大量消费者对魅KTV新推出的AI视频功能的负面评价,引发广泛关注。众多用户纷纷发帖抱怨,称该功能生成的抽象艺术风格画面严重影响了K歌体验的沉浸感,甚至有人表示无法接受这种视觉上的"干扰"。 走访多家魅KTV门店后发现,AI视频系统已在部分门店全面上线。在一家已启用该系统的门店,工作人员透露了令人惊讶的细节:系统更新后,所有歌曲默认播放A...
08:29
8月5日,浙江台州一位年仅3岁的幼童凭借惊人的运动天赋引爆网络,成为全网热议的焦点。视频中,这个尚在穿着尿不湿的幼儿在定制双杠上流畅翻转,在吊环间自如摆荡,其协调性与力量感远远超越同龄儿童,被网友们亲切地称为"先天体操圣体"。 据孩子母亲徐女士分享,这个小家伙在尚未满2岁时就展现出对支撑动作的浓厚兴趣,经常扶着家具完成类似俯卧撑的姿势。当发现孩子拥有运动...
08:29
波音公司周二在美国宣布,其备受瞩目的777-9机型圆满完成首次试飞,标志着这款新一代宽体客机迈出了关键性一步。本次试飞历时2小时27分钟,飞行员团队与系统操作员、飞行分析师密切协作,全面验证了飞机的操控性能和各项关键指标。作为波音旗舰机型的最新升级版,777-9不仅延续了家族经典的优雅外形,更在航程、燃油效率和客舱空间上实现了显著突破,预计将进一步提升全球航...
08:29
2025年8月6日,国内知名化工企业利民股份(股票代码002734)发布重要通知,宣布将对旗下核心产品代森锰锌原药及其相关制剂产品的售价进行调整。此次价格上调主要受近期极端高温天气及原材料供应链紧张等多重因素影响,导致公司生产成本显著增加。根据公告内容,自即日起,代森锰锌系列产品价格将整体上调5%。此次调整旨在帮助公司缓解当前经营压力,确保产品稳定供应,同时...
08:29
8月6日,永和智控正式发布一则备受市场关注的公告,宣布公司控股股东曹德莅与杭州润锋智能装备有限责任公司达成一项重要的股份转让协议。根据协议内容,曹德莅将以每股8.97元的价格,将其持有的永和智控8%股份悉数转让给杭州润锋,涉及股份数量高达3566.03万股,交易总金额达到了3.2亿元人民币。这一交易不仅标志着公司股权结构的重大调整,更预示着永和智控未来可能迎...
08:29
北京时间8月6日,亚马逊正式宣布一项重大合作进展,其云计算巨头亚马逊云服务(AWS)将在备受瞩目的Bedrock和SageMaker两大平台上,面向全球开发者提供OpenAI的gpt-oss-120b和gpt-oss-20b模型。这一举措不仅标志着AWS首次正式引入OpenAI的产品,更在云计算AI服务领域掀起了一场新的变革浪潮。 此次合作打破了微软Azur...
08:29
2025年8月6日 星期三 概述 受科技与电子股普遍走低影响,日韩股市早盘表现疲软。日经225指数以0.3%的跌幅开盘,报收40430.46点,其中科技板块与电子股成为主要拖累因素。韩国KOSPI指数开盘跌幅更为显著,下挫0.5%,最终报至3182.06点,市场整体呈现震荡下行态势。 分析显示,近期全球经济波动对亚洲科技股造成连锁反应。日韩两国市场中的半导体...
08:29
2025年8月6日,北京时间,前社交媒体巨头X平台的首席执行官琳达·雅卡里诺正式宣布,将出任远程医疗公司eMed Population Health的CEO一职。eMed Population Health作为行业领先者,专注于GLP-1类减肥药物的管理与服务,致力于通过数字化手段提升患者用药体验与健康管理效率。这一任命标志着医疗健康领域与互联网科技的一次深...
08:29
2025年8月6日,北京时间,社交巨头Snap Inc正式发布了其第二季度财报,引发了市场广泛关注。数据显示,公司广告收入增速显著放缓,从上一季度的9%大幅降至3%-4%区间。这一消息公布后,Snap股价在盘后交易中遭遇重挫,跌幅超过17%,反映出投资者对业绩表现的不满情绪。 根据财报披露,本季度Snap总销售额为13.45亿美元,略低于市场分析师的普遍预期...
08:29
2025年8月5日,上纬新材(股票代码688585)发布紧急公告,宣布公司股价近期累计暴涨1320.05%,已严重偏离基本面,可能再次启动连续停牌核查程序。针对此情况,上海证券交易所迅速作出回应,指出部分投资者存在异常交易行为,已依法依规暂停相关账户的交易权限。上纬新材在公告中进一步披露,2025年上半年公司净利润同比下降32.91%,动态市盈率飙升至480...
08:29
2025年8月6日,科润智控董事长王荣在公开场合掷地有声地宣布,公司当前阶段正处于“二次创业”的关键时期,并将海外市场作为未来发展的重中之重。作为国内北交所上市的变压器行业领军企业,科润智控正借助资本市场的强劲东风,全面加速全球化布局。今年初,公司成功中标非洲电气化项目,合同金额高达732.12万美元,这一重大突破不仅彰显了其技术实力,更标志着其国际市场拓展...