【AIbase 报道】2023年8月12日,昆仑万维在其 SkyWork AI 技术发布周上,隆重推出了全新自研的交互式世界模型——Matrix-Game2.0。这一里程碑式的升级版本,不仅刷新了行业对开源世界模型的认知,更标志着昆仑万维在多模态AI领域的重大突破。作为Matrix系列的进化之作,Matrix-Game2.0开创性地实现了通用场景下的实时长序列生成,成为业内首个具备这一核心能力的开源模型。
Matrix-Game2.0在核心性能上实现了质的飞跃,能够以每秒25帧的稳定速度生成连续视频内容,最长可达分钟级时长,显著提升了生成内容的连贯性与实用性。该模型在物理规律和场景语义理解方面取得重大进展,用户只需通过简单指令即可自由探索和操控虚拟环境,获得前所未有的沉浸感与可控性体验。
在技术架构层面,Matrix-Game2.0引入了革命性的视觉驱动交互建模方案,彻底摒弃了传统依赖语言提示的生成模式。其底层采用先进的3D因果变分自编码器(VAE)与多模态扩散Transformer架构,能够高效压缩时空维度,并根据用户动作指令逐帧生成符合物理逻辑的动态视觉序列。这种创新架构赋予模型强大的跨域适应性,支持多种场景与视觉风格的灵活模拟。
Matrix-Game2.0的发布突破了传统交互式世界模型的诸多瓶颈,展现出在游戏内容创作、虚拟现实和智能交互系统等领域的巨大应用潜力。在GTA和Minecraft等经典游戏场景中,该模型已展现出卓越的交互能力,可生成符合物理逻辑的可交互视频内容。昆仑万维表示,Matrix-Game2.0的持续迭代与开源行动,代表了中国在空间智能研究领域的新里程碑,将对具身智能体训练、虚拟游戏世界的快速搭建以及影视与元宇宙内容生产产生深远影响。