
腾讯正式推出混元世界模型1.5(Tencent HY WorldPlay),标志着国内首个开放的实时互动体验平台正式问世。这一创新平台能够通过简单的文字描述或图片输入,迅速构建出独一无二的互动虚拟世界。用户只需借助键盘、鼠标或手柄,即可实时操控虚拟相机,像体验游戏一样自由探索由 AI 生成的沉浸式场景。
混元世界模型1.5的核心优势体现在三大关键技术能力上。首先,其具备卓越的实时交互生成能力,通过原创的 Context Forcing 蒸馏方案和流式推理优化技术,能够以高达24帧每秒的速度渲染720P高清视频,确保流畅的视觉体验。其次,模型实现了长范围的3D一致性,当用户离开某个区域后再返回时,系统能够精准”记忆”该区域的三维结构,从而保持场景的完整连贯性。最后,模型支持多样化的交互体验,可适配不同风格的游戏或现实场景,并具备多视角切换和实时文本触发事件等丰富功能。
此次发布的混元世界模型1.5还实现了业内最全面的实时世界模型训练体系开源,涵盖数据采集、训练流程和推理部署等全链路环节。腾讯混元团队在技术白皮书中详细阐述了模型的预训练机制、持续训练方法和自回归视频模型的强化学习等核心技术细节。该模型采用Next-Frames-Prediction的视觉自回归任务设计,成功突破了实时性与几何一致性之间的传统矛盾,为世界建模技术带来了革命性突破。

混元世界模型1.5不仅在技术层面取得重大突破,更开启了AI生成内容的新纪元。未来的AI将不再局限于文本、图像或视频的单媒体生成,而是能够创造出可实时探索和互动的完整虚拟世界。这种创新模式在游戏开发、影视特效、虚拟现实等众多领域具有广阔的应用前景。
在线体验平台:https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay
GitHub代码库:https://github.com/Tencent-Hunyuan/HY-WorldPlay
Hugging Face模型:https://huggingface.co/tencent/HY-WorldPlay
项目官方主页:https://3d-models.hunyuan.tencent.com/world/
划重点:
🌍 腾讯混元世界模型1.5支持通过文字或图片快速生成互动虚拟世界,实现实时沉浸式探索体验
🎮 模型融合实时交互生成、长程3D一致性及多样化交互功能,打造全方位虚拟世界交互体验
🔧 首次开源的训练体系为AI生成内容领域提供标准化解决方案,推动行业技术革新
