腾讯混元2.0大模型重磅发布多项能力再创新高

2025-12-06 09:52:25 AI动态 1 次阅读

腾讯正式发布自研大模型混元2.0（Tencent HY2.0），标志着公司在人工智能领域的技术实力再上新台阶。与此同时，DeepSeek V3.2也逐步融入腾讯生态体系，两大模型的协同发展将为用户带来更丰富的AI体验。目前，Tencent HY2.0已率先在元宝、ima等腾讯AI原生应用中落地，腾讯云也同步开放了相关模型的API及平台服务，为开发者提供更便捷的技术支持。

Tencent HY2.0采用先进的混合专家（MoE）架构，总参数量高达406B（激活参数32B），支持256K超长上下文窗口，其推理能力和效率在业界处于领先地位。与上一版本（Hunyuan-T1-20250822）相比，HY2.0Think在预训练数据和强化学习策略上实现了显著突破。在数学、科学、代码、指令遵循等复杂推理场景中，其综合表现稳居国内第一梯队，泛化性也大幅提升。

在数学科学知识推理方面，HY2.0Think通过使用高质量数据并进行Large Rollout强化学习，显著增强了推理能力。在国际数学奥林匹克竞赛（IMO-AnswerBench）和哈佛MIT数学竞赛（HMMT2025）等权威测试中，该模型取得了优异的成绩。结合预训练数据的进步，模型在极度考验知识水平的Humanitys Last Exam（HLE）和泛化性的ARC AGI等任务上也有大幅提升。

在指令遵循与长文多轮能力上，HY2.0Think通过重要性采样修正缓解了训练和推理不一致问题，实现了长窗口RL的高效稳定训练。同时，借助多样化可验证的任务沙盒以及基于打分准则的强化学习，该模型在Multi Challenge等指令遵循和多轮任务上的效果显著提升。

在代码与智能体能力方面，腾讯构建了规模化的可验证环境及高质量合成数据，极大增强了模型在Agentic Coding及复杂工具调用场景下的落地能力。在SWE-bench Verified及Tau2-Bench等面向真实应用场景的智能体任务上，该模型实现了显著跃升。腾讯云的API及平台服务也为开发者提供了更强大的技术支持，助力AI应用落地。