阿里云旗下前沿 AI 研究团队 Qwen 宣布正式推出其最新一代 AI 模型——Qwen3-Max,这款具有里程碑意义的超大规模模型标志着人工智能技术迈入全新发展阶段。Qwen3-Max 在权威评测平台 LMArena 文本排行榜中位列全球第三,不仅超越了 OpenAI 的 GPT-5-Chat 等国际顶尖模型,更在代码生成、智能体交互等核心能力上实现了全面突破。
Qwen3-Max 模型拥有超过 1 万亿参数规模,其预训练过程处理了高达 36 万亿 tokens 的海量数据,这一参数规模和训练数据量均处于行业领先水平。得益于 Qwen3 系列独创的 MoE(Mixture of Experts)模型架构创新,Qwen3-Max 在训练稳定性与效率方面取得重大突破。通过自主研发的 PAI-FlashMoE 多级流水并行技术,该模型训练效率较上一代产品提升 30%,而 ChunkFlow 长序列训练策略更是将吞吐量提升 3 倍,可支持高达 100 万个长上下文的并发处理。
作为 Qwen3 系列的核心成员,Qwen3-Max-Instruct 模型在业界权威编程基准测试 SWE-Bench Verified 中以 69.6 分的卓越成绩脱颖而出,充分证明其在解决实际编程难题方面的强大能力。更令人瞩目的是,该模型在智能体工具调用能力测试 Tau2-Bench 中取得 74.8 分的领先表现,不仅超越了 Claude Opus4 和 DeepSeek-V3.1 等主流竞品,更在智能交互领域实现技术飞跃。
特别值得一提的是 Qwen3-Max-Thinking 推理增强版,这款集成了代码解释器与并行计算技术的创新产品,在 AIME25 和 HMMT 等极具难度的数学推理基准测试中实现满分突破。Qwen 团队对这款增强版模型的市场前景充满期待,表示将加速推进其商业化进程。
目前,用户已可通过阿里云 API 平台直接体验 Qwen3-Max-Instruct 模型的强大功能。开发者只需完成简单的注册流程获取 API 密钥,即可调用这款高性能 AI 模型进行各类开发应用。Qwen3-Max 的问世不仅推动人工智能技术持续创新,更为全球开发者提供了前所未有的强大工具,助力各行业实现智能化转型。随着这项技术的广泛应用,Qwen 团队坚信人工智能将开启更加广阔的发展新纪元。