阿里云今日震撼发布通义千问系列迄今规模最大、能力最强的语言模型——Qwen3-Max。这款革命性模型总参数量突破1万亿大关,预训练数据量高达36万亿tokens,展现出惊人的知识处理与生成能力。在知识推理、代码生成、智能体任务等多项权威基准测试中,Qwen3-Max均取得压倒性领先表现,为自然语言处理领域树立了新的标杆。
Qwen3-Max-Instruct正式版在代码能力与智能体性能上实现再突破。该版本在SWE-Bench Verified测试中斩获69.6分的高分,在Tau2-Bench工具调用测试中更是以74.8分的卓越成绩超越Claude Opus 4等国际顶尖模型,充分彰显了其在实际应用场景中的强大竞争力。这一突破性进展标志着我国人工智能技术已达到国际领先水平。
令人瞩目的是,其推理增强版本Qwen3-Max-Thinking在高难度数学推理领域实现零失误。在AIME 25、HMMT等极具挑战性的测试中,该模型以100%的准确率刷新纪录,展现了超凡的逻辑推理能力。据官方透露,这款备受期待的模型预计将于近期向公众开放,为科研工作者和开发者提供强大助力。
得益于创新的MoE架构与PAI-FlashMoE并行优化技术,Qwen3-Max在模型训练的稳定性与效率方面取得重大突破。长序列训练吞吐量达到序列并行方案的3倍,并支持高达1M的上下文长度,为处理超长文本提供了前所未有的技术支持。这一技术革新将极大推动自然语言处理在复杂场景中的应用,为各行各业带来智能化转型新机遇。
