
微新创想9月24日讯 2025云栖大会今日盛大开幕,备受瞩目的阿里通义旗舰模型Qwen3-Max震撼问世,其卓越性能超越GPT5、Claude Opus 4等国际顶尖模型,强势跻身全球前三行列。这款创新力作不仅彰显了阿里在人工智能领域的领先地位,更将大模型技术推向了新的高度。
据悉,Qwen3-Max精心打造了指令(Instruct)与推理(Thinking)两大版本,其预览版在Chatbot Arena排行榜上已斩获第三名的好成绩,而正式版预计将再次刷新纪录。作为通义千问家族中规模最大、能力最强的基础模型,Qwen3-Max拥有高达36T tokens的预训练数据量和超过万亿的总参数,展现出惊人的Coding编程能力和Agent工具调用能力。

在大模型运用Coding解决真实世界问题的SWE-Bench Verified测试中,Instruct版本以69.6分的优异成绩位列全球第一梯队;在聚焦Agent工具调用能力的Tau2-Bench测试中,Qwen3-Max更是取得突破性的74.8分,不仅超越Claude Opus4和DeepSeek-V3.1,更彰显了其强大的实用价值。
与此同时,Qwen3-Max的推理增强版本Qwen3-Max-Thinking-Heavy同样表现亮眼,通过结合工具调用和并行推理技术,其推理能力创下新高。特别是在聚焦数学推理的AIME 25和HMMT测试中,该模型均以满分100分的卓越表现刷新纪录,实现了国内大模型在该领域的零的突破。
Qwen3-Max推理模型之所以能够取得如此骄人成绩,关键在于其能够像人类一样灵活调动工具,通过编写代码高效解题。此外,测试时增加的计算资源也为模型表现提供了有力支撑,使其在复杂任务中游刃有余。

目前,通义千问系列模型已实现从0.5B到超万亿的全尺寸覆盖,旗下三百余款大模型各具特色,能够满足不同场景下的多样化需求。即日起,广大用户即可在通义千问QwenChat上免费体验Qwen3-Max的强大功能,或通过阿里云百炼平台调用API服务,亲身感受这一人工智能技术的震撼魅力。
