2025年7月27日,备受瞩目的2025世界人工智能大会腾讯论坛隆重举行,腾讯公司在此正式发布了混元3D世界模型1.0版本,并宣布将这一创新成果全面开源。这一历史性时刻标志着业界首个支持沉浸漫游、交互与仿真的开源世界生成模型正式诞生,为游戏开发、虚拟现实(VR)及数字内容创作等领域注入了革命性的活力,开辟了前所未有的发展空间。

混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术,能够接受文字和图片作为输入,快速生成高质量、风格多样的可漫游3D场景。这一技术突破极大地简化了3D场景的构建流程,过去需要专业建模团队数周才能完成的工作,现在通过简单的文字指令或图片上传,几分钟内即可实现。对于游戏开发者而言,该模型能够迅速生成包含建筑、地形、植被等元素的完整3D场景,输出的Mesh文件可直接用于游戏原型搭建或关卡设计,同时支持前景物体调整和天空背景更换,满足个性化创作需求。即便是没有建模经验的普通用户,也能通过混元3D创作引擎,轻松生成360°沉浸式视觉空间,并无缝导入Vision Pro等虚拟头显设备,享受沉浸式体验。

混元3D世界模型1.0的核心优势在于其创新的“语意层次化3D场景表征及生成算法”。该算法将复杂的3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离,不仅生成视觉效果逼真的整体场景,还能输出标准化的3D Mesh资产,兼容Unity、Unreal Engine、Blender等主流工具,便于用户对场景内元素进行独立编辑或物理仿真,实现了AIGC技术与传统CG工作流的无缝衔接。与全球领先的开源模型相比,混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等关键指标上均实现了全面超越。

腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。其中,混元旗舰模型TurboS自年初发布以来,保持着每月一个版本的快速迭代,在代码生成、理科能力和复杂指令遵循方面均有显著提升,稳居全球大模型权威排行榜前列。基于TurboS基座开发的混元T1进一步提升了推理能力,展现出国内领先的综合能力。同时,端到端语音模型混元Voice、多模态理解模型混元Vision等也基于混元大语言模型基座打造,继承了出色的理解、认知和推理能力,在多模态理解领域屡获佳绩。

腾讯混元3D世界模型开源:沉浸式交互式3D场景生成技术突破插图

腾讯混元在多模态生成方面同样布局全面,3D生成能力全球领先。最新发布的混元3D2.5模型质感大幅提升,在上海人工智能实验室的评测中排名全球第一。除混元3D世界模型1.0外,腾讯还将在月底开源一系列小尺寸模型,包括0.5B、1.8B、4B、7B混合推理模型,更加轻量且易于部署。同时,多模态理解模型混元-large-vision和专为游戏场景优化的交互式游戏视频生成框架混元GameCraft等也将于近期对外开源。腾讯混元还开放了完整的多模态生成能力及工具集插件,陆续开源了业界领先的文生图、视频生成和3D生成能力,提供了接近商业模型性能的开源基座,方便社区基于业务和使用场景进行定制。

目前,混元3D系列模型的社区下载量已超过230万次,成为全球最受欢迎的3D开源模型之一。腾讯混元 3D 世界模型 1.0:●项目主页:https://3d-models.hunyuan.tencent.com/world/●体验地址:https://3d.hunyuan.tencent.com/sceneTo3D●Hugging Face 模型地址:https://huggingface.co/tencent/HunyuanWorld-1●Github 项目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0

最新快讯

2026年03月04日

08:08
微新创想:2026年3月4日,美国得克萨斯大学奥斯汀分校的研究团队在超薄二维磁性材料中,随温度降低依次观测到两种罕见的磁性状态。这一发现不仅填补了理论研究的空白,还为理解低维磁性系统提供了新的视角。 研究团队在原子级厚度的材料中进行了深入实验,成功揭示了在维度受限条件下磁序变化的新机制。这些磁性状态的出现与温度变化密切相关,表现出独特的物理特性,为后续的理论...
08:08
微新创想:2025年第四季度全球电视出货量达到6150万台,整体市场保持稳定态势。尽管整体表现平稳,但中国市场因受到补贴退坡以及前期消费透支的影响,电视出货量同比下降了25.3%。面对国内市场增速放缓的挑战,TCL与海信积极调整战略,将重点转向海外市场。在北美市场,这两家中国品牌实现了显著增长,合并市场份额提升至30.7%,比去年同期增长了2.1个百分点。 ...
08:08
微新创想:2026年3月3日,Anthropic宣布在其编程工具Claude Code中逐步推送全新语音模式。这一功能被内置于底层架构,使得拥有内测权限的用户能够在欢迎界面直接启用。用户只需长按空格键即可通过语音输入开发需求,松开按键后系统便会自动发送执行指令。这种方式大幅降低了传统文本输入的复杂性,提升了开发效率。 该语音功能的推出,标志着Claude C...
08:08
微新创想:3月4日 加拿大滑铁卢大学领衔的国际科研团队发布了一项新研究 提出了一种可增强大语言模型‘人类智慧’的训练方法 该方法聚焦于支持明智推理的新型模型架构 并配套构建了衡量AI智慧水平的评估基准 研究在《认知科学趋势》最新期刊发表 此举旨在突破当前AI在常识推理 价值权衡与情境适应等方面的局限 推动AI向更类人的认知能力演进
08:08
微新创想:3月4日,美国杰克逊实验室与麻省理工学院联合研发出新型微针贴片,可在皮肤表面无痛、无创采集人体关键免疫细胞。这项突破性技术无需抽血或活检,通过微米级可溶性针阵列穿透角质层,特异性捕获树突状细胞等免疫细胞。研究团队在临床前模型中验证了其有效性,为动态免疫监测和个性化疫苗响应评估提供了一种全新的工具。该成果发表于《自然·生物医学工程》,标志着免疫检测技...
08:08
微新创想:2026年3月4日8时 三峡南线船闸正式启动年度计划性停航检修 此次检修是自2003年三峡船闸通航以来的第9次计划性停航。检修工作将持续约35天 由长江三峡通航管理局统一组织与实施 检修工作主要集中在湖北省宜昌市三峡水利枢纽南线船闸区域 包括闸门 启闭机 电气系统以及助航设施等多个关键部分的全面维护和技术升级 通过此次检修 三峡南线船闸将全面提升通...
07:37
微新创想:3月11日,苹果将在美国旧金山举办的游戏开发者大会(GDC)上举行三场专题演讲,全面推动其游戏生态建设。首场演讲将聚焦苹果软硬件协同开发,深入探讨如何通过系统级优化提升游戏性能与用户体验。这一环节不仅展示了苹果在硬件与软件整合方面的技术实力,也为开发者提供了宝贵的参考和灵感。 次场演讲由CD Projekt Red带来,将详细解析《赛博朋克2077...
07:37
微新创想:河北维达康生物科技股份有限公司在2026年3月4日前于河北证监局完成IPO辅导备案 辅导机构为中信建投证券 公司成立于2021年 注册资本达到1.4亿元 注册地设在河北省保定市满城区于家庄镇 公司专注于膳食补充剂 天然色素 香料以及医药中间体等合成生物学产业化领域 作为国家认定的“专精特新”小巨人企业 公司在科技创新方面表现突出 牵头承担了河北省“...
07:37
微新创想:2026年3月3日晚,苹果公司正式发布全新Studio Display及Studio Display XDR显示器。两款产品专为Mac优化,普通版起售价11999元,XDR版24999元起。新显示器采用100%再生铝支架,标准版屏幕含80%再生玻璃,系苹果首次达成该环保指标;包装盒为可折叠全纤维设计,便于拆解回收。此举旨在降低运输与回收环节的环境负...
07:37
微新创想:2026年3月3日,谷歌正式推出Gemini 3.1 Flash-Lite模型,宣称为其速度最快、成本效益最高的Gemini 3系列轻量级模型。该模型即日起向开发者开放预览版,可通过Google AI Studio的Gemini API及企业级Vertex AI平台调用。这一发布标志着谷歌在大模型领域持续发力,进一步拓展其在AI应用中的影响力。 G...
07:36
微新创想:2026年3月3日晚,苹果正式推出Studio Display XDR专业显示器。这款27英寸的5K Retina XDR屏幕采用了先进的mini-LED背光技术,带来了卓越的显示效果。其HDR峰值亮度高达2000尼特,确保了在各种光照条件下都能呈现出细腻的色彩与高对比度。同时,该显示器支持120Hz自适应刷新率,为用户提供流畅的视觉体验。 微新创...
06:55
微新创想:3月4日,新闻集团与Meta Platforms宣布达成多年期人工智能内容授权协议。协议为期至少三年,自2026年起生效。该协议标志着两家公司在人工智能领域迈出了重要一步。 微新创想:根据协议内容,Meta将每年向新闻集团支付最高5000万美元。这笔费用将用于获取新闻集团旗下知名媒体如《华尔街日报》《泰晤士报》等的内容授权。这些内容将被用于AI模型...