
微新创想:阿里巴巴近期发布了全新一代千问旗舰模型Qwen3.7-Max,该模型已全面接入千问APP、PC端及网页端。用户只需将千问APP更新至最新版本(6.9.7及以上),点击下方胶囊图标即可体验Qwen3.7-Max。同样,在PC端和网页端的对话界面中,用户可以通过模型选择栏下拉切换,第一时间享受这一新版本带来的功能升级。

在三方机构Artificial Analysis最新公布的全球大模型榜单中,Qwen3.7-Max以56.6分的成绩位列全球第五,同时成为国产大模型中的第一名。这一成绩标志着阿里巴巴在大模型研发领域持续领先,并在全球范围内展现出强大的竞争力。
在编程智能体方面,Qwen3.7-Max表现突出。在SWE-Pro和SWE-Multilingual等测评中均取得领先,特别是在Terminal Bench 2.0-Terminus测试中,其得分达到69.7,超过了DeepSeek-v4-pro-Max、Claude-Opus4.6等多款国际知名模型,展现出卓越的代码生成与执行能力。

在通用智能体方面,Qwen3.7-Max也实现了显著提升。在MCP-Atlas、MCP-Mark、Skillbench等现实能力测试中,其表现优异,超越了GLM5.1、Kimi-K2.6等模型,创下国产新高。此外,Qwen3.7-Max在Kernel Bench L3测试中展示了强大的GPU内核优化能力,进一步巩固了其在高性能计算领域的领先地位。
在推理能力方面,Qwen3.7-Max同样表现出色。在GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench等核心推理测评中,其得分均超过了Claude-Opus4.6,并且在所有国产模型中遥遥领先。这表明Qwen3.7-Max在复杂逻辑推理和问题解决能力上具有显著优势。
在通用能力与多语言处理方面,Qwen3.7-Max也取得了突破性进展。在指令遵循评测IFBench中,其得分高达79.1分,创下新高。同时,在多语言理解和翻译的WMT24和MAXIFE评测中,Qwen3.7-Max同样领先,展现出对多种语言的强大支持与处理能力。
