昆仑万维在北京举办的 SkyWork AI 技术发布周上,隆重推出了 Matrix-3D 这一革命性的 3D 世界生成大模型,为 3D 生成技术领域带来了突破性的进展。这一创新成果旨在突破传统 3D 场景生成技术的瓶颈,解决其在视角范围、几何一致性和视觉质量方面长期存在的局限性。传统方法往往需要依赖多视角输入才能构建完整的 3D 世界,而 Matrix-3D 则通过整合全景视频生成和三维重建技术,实现了从单张图像到高质量、可探索的 3D 空间的无缝转换。

Matrix-3D 的核心技术优势主要体现在以下几个方面。首先,其轨迹引导的全景视频生成模块通过使用场景 Mesh 渲染图作为条件输入,训练出能够生成符合相机轨迹的全景视频的视频扩散模型。这一技术不仅提高了视频在空间结构上的一致性,还有效减少了遮挡错误和图像伪影,从而生成更加逼真的 3D 场景。其次,双路径全景 3D 重建模块为用户提供了两种优化路径选择。一种是通过对超分辨率和 3D 结构进行优化,获取高质量的 3D 模型;另一种则是基于 Transformer 的前馈网络,能够快速预测 3D 几何属性,实现高效重建。最后,Matrix-Pano 数据集的规模庞大,包含 116K 条带有相机轨迹、深度图和文本注释的静态全景视频序列,为生成模型的训练提供了坚实的基础。

昆仑万维Matrix-3D开源:单图生成高质量全景视频插图

Matrix-3D 支持用户通过文本或图像输入,生成可自由探索的 3D 场景,其主要特点包括视角一致性、几何与色彩一致性,以及精准控制与范围扩展。视角一致性确保生成的 3D 场景支持 360 度自由环视,内容始终保持一致;几何与色彩一致性则保证了生成的 3D 场景在几何关系和遮挡关系上准确无误,不同区域颜色协调统一;精准控制与范围扩展则允许用户根据输入轨迹生成不同的 3D 场景,并在生成的场景基础上进行无限扩展。

Matrix-3D 作为 3D 世界生成的重要里程碑,预计将在多个领域发挥重要作用。在游戏与影视制作领域,Matrix-3D 能够快速生成高质量的 3D 场景,显著降低制作成本,同时提高沉浸感。在具身智能领域,Matrix-3D 可以构建可控的模拟环境,为机器人训练和自动驾驶测试提供强大的支持。此外,Matrix-3D 还具有广泛的应用前景,有望在虚拟现实、增强现实、数字孪生等领域发挥重要作用。

昆仑万维Matrix-3D开源:单图生成高质量全景视频插图1

昆仑万维的 Matrix-3D 项目主页及相关技术报告现已上线,进一步推动 3D 生成技术的发展。用户可以通过以下链接获取更多信息:GitHub:https://github.com/SkyworkAI/Matrix-3D,HuggingFace:https://huggingface.co/Skywork/Matrix-3D,技术报告:https://github.com/SkyworkAI/Matrix-3D/blob/main/asset/report.pdf,项目主页:https://matrix-3d.github.io/。

最新快讯

2026年03月05日

12:23
微新创想:近日广西贵港发生了一件令人意想不到的事情。一位车主在驾驶过程中发现车辆出现异常,一踩刹车便传来奇怪的异响。起初他并未太过在意,想着等第二天去保养时再一探究竟。然而,当保养师傅对车辆进行检查后,车主顿时感到震惊不已——车底竟然被老鼠塞满了红薯和玉米,重量达到了20斤。这一发现让车主感到既惊讶又无奈,不禁感叹:“这老鼠也太聪明了吧,怎么能把这么多食物搬...
12:23
微新创想:在冰天雪地的黑龙江,寒冬里正上演着一场暖心的营救与新生故事。近日,一位女子驾车前往黑河市,途中竟在路边碰到一只正徘徊求助的动物。当时四周是荒郊野岭,天气又冷得刺骨,女子一时也拿不准这到底是流浪狗还是野狼,心里直犯嘀咕。为了安全着想,她没敢贸然停车帮忙,而是继续开着车往前走。 可这只狗狗特别执着,在后面撒开腿拼命追,一跟就是好几公里。女子看到狗狗这么...
12:23
微新创想:近日,一则关于20岁小伙因长期在嘈杂健身房使用骨传导耳机导致耳聋的消息在网络上引发了广泛关注。据报道,这位运动爱好者小李,由于健身时习惯性佩戴骨传导耳机,近期被医生确诊为噪声性耳聋。这一案例再次将慢性声损伤对听力的潜在危害推到了公众视野中。 医生指出,像小李这样的感音神经性听力损伤,一旦超过3到6个月,恢复难度极大。很多人误以为骨传导耳机因为不经过...
12:23
微新创想 3月5日消息 昨天 鸿蒙智行召开技术焕新发布会 新一代双光路图像级激光雷达迎来全球首发 华为常务董事 终端BG董事长余承东在发布会后透露 新一代双光路图像级激光雷达首发 全球量产最高896线数 几年前我担任车BU的CEO 就开始开发这款激光雷达 很不容易 今天终于与消费者见面 此次发布的华为新一代激光雷达为全球量产领域线数最高的896线超高精度...
12:23
微新创想 全国政协委员、360集团创始人周鸿祎近日透露自己已接受眼部手术更换人工晶体摘掉眼镜以适配AI眼镜并笑称眼神更像机器人了。这一举动引发广泛关注同时也展现出他对未来科技趋势的敏锐洞察。 微新创想 周鸿祎在谈及AI眼镜时表示佩戴存在反人性痛点必须找到强功能强场景才能真正普及。他指出当前AI眼镜市场面临诸多挑战其中最为关键的是如何突破用户的使用习惯与实际需...
12:23
微新创想:一加15T将于3月发布 新机在性能 续航 体验等方面全面拉满 一加15T被官方称为小屏党期待的Dream Phone。这款新机在多个方面进行了升级,旨在为用户带来更极致的使用体验。作为一加品牌在小屏旗舰领域的重要布局,一加15T不仅延续了小屏手机的便携优势,更在核心配置上实现了突破。 今日一加中国区总裁李杰正式宣布,一加15T将首发7500mAh超...
12:23
微新创想 小鹏汽车近日正式宣布G6超级增程车型将于明天下午正式上市。这款新车不仅在续航能力上实现了重大突破,还在智能驾驶、充电效率、空间设计等多个方面展现出强大的竞争力。 微新创想 G6超级增程车型的最大亮点之一是其超长的综合续航里程,达到1704公里,这一成绩在全球范围内处于领先地位。同时,其纯电续航里程也达到430公里,远超同级别车型,为用户提供了更加灵...
11:52
微新创想:一位养老院里的老爷爷因为解答高中物理题意外走红网络 最近,一段视频在网络上引起了广泛关注。视频中,一位年迈的老爷爷认真地解答高中物理题目,展现出令人敬佩的学习态度和智慧。他的专注与认真,不仅让视频的拍摄者小任感动,也让无数网友为之动容。 视频里,老爷爷头发花白,神情严肃,拿着题目仔细思考。他的样子被网友们形容为“可爱又励志”,仿佛一位重返校园的老学...
11:52
微新创想:近日一则关于20岁小伙因长期在嘈杂健身房佩戴骨传导耳机导致听力受损的新闻引发了广泛讨论。该事件让公众开始关注日常生活中潜在的听力健康风险。据多家媒体报道,这位名叫小李的运动爱好者,由于在健身房锻炼时长时间使用骨传导耳机,近期被确诊为噪声性耳聋。 医生指出,这种类型的感音神经性听力损伤一旦持续超过3到6个月,恢复的几率将大大降低。骨传导耳机虽然不经过...
11:52
微新创想:钻石市场最近发生了巨大的变化,许多消费者都感到意外和惊喜。十年前,一颗1克拉的天然钻石动辄就要花费数万元,这让不少人望而却步。然而,如今情况完全不同,同样品质的1克拉培育钻石,价格已经降至1000多元,几乎可以说是“白菜价”了。这种价格的大幅下降,让不少消费者直呼“没想到”。 钻石价格的波动背后,是培育钻石技术的不断突破和成熟。随着科技的发展,培育...
11:52
微新创想:最近广西南宁理工学院东盟校区发生了一件令人惊喜又有趣的事情,一只被师生们亲切称为“鹅学长”的大白鹅在网络上迅速走红。这只鹅不仅在校园里自由活动,还常常出现在教室中,与学生们“同堂听课”,展现出独特的校园生活场景。据学校工作人员介绍,这只“鹅学长”原本是饲养在校园景观湖里的,性格温顺,与师生互动频繁,深受喜爱。 它不仅不怕人,反而喜欢在人多的地方出现...
11:52
微新创想:周黑鸭(01458.HK)于3月4日发布2025年业绩预告,预计全年总收入将达到25.2亿至25.5亿元,同比增长2.8%至4.0%。这一增长表现得益于公司在多个方面的积极调整与优化。首先,门店结构的优化使得整体运营效率得到提升。其次,单店的盈利能力增强,进一步推动了收入的增长。此外,公司新设渠道事业部,致力于拓展多元销售渠道,为品牌带来新的增长点...