阿里云通义千问Qwen3-Max破万亿参数创纪录

2025-09-24 11:13:27 快讯 6 次阅读

阿里云今日震撼发布通义千问系列迄今规模最大、能力最强的语言模型——Qwen3-Max。这款革命性模型总参数量突破1万亿大关，预训练数据量高达36万亿tokens，展现出惊人的知识处理与生成能力。在知识推理、代码生成、智能体任务等多项权威基准测试中，Qwen3-Max均取得压倒性领先表现，为自然语言处理领域树立了新的标杆。

Qwen3-Max-Instruct正式版在代码能力与智能体性能上实现再突破。该版本在SWE-Bench Verified测试中斩获69.6分的高分，在Tau2-Bench工具调用测试中更是以74.8分的卓越成绩超越Claude Opus 4等国际顶尖模型，充分彰显了其在实际应用场景中的强大竞争力。这一突破性进展标志着我国人工智能技术已达到国际领先水平。

令人瞩目的是，其推理增强版本Qwen3-Max-Thinking在高难度数学推理领域实现零失误。在AIME 25、HMMT等极具挑战性的测试中，该模型以100%的准确率刷新纪录，展现了超凡的逻辑推理能力。据官方透露，这款备受期待的模型预计将于近期向公众开放，为科研工作者和开发者提供强大助力。

得益于创新的MoE架构与PAI-FlashMoE并行优化技术，Qwen3-Max在模型训练的稳定性与效率方面取得重大突破。长序列训练吞吐量达到序列并行方案的3倍，并支持高达1M的上下文长度，为处理超长文本提供了前所未有的技术支持。这一技术革新将极大推动自然语言处理在复杂场景中的应用，为各行各业带来智能化转型新机遇。

2026年02月11日

09:45

阿里云通义千问Qwen3-Max破万亿参数创纪录

最新快讯

2026年02月11日

萝卜快跑与Uber联手迪拜打造全无人出行新标杆

京东自建欧洲物流JoyExpress上线提升本地履约能力

抖音生活服务推出全新团购App“抖省省”拓展本地生活服务场景

伪造7-Zip官网传播木马伪装安装包窃取设备权限

雷军宣布初代小米SU7停产推动技术迭代升级

微软Windows 11推出新安全机制强化权限管控与系统保护

中信银行再注资20亿中信金租注册资本达120亿助力绿色战略发展

微软2026年启动Windows安全启动证书轮换计划保障系统安全

Chrome 145正式回归JPEG-XL图像格式支持提升安全性与性能

豫能控股联手河南投资集团参股先天算力并收购郑州合盈控股权

歌礼制药创新口服多肽ASC36进入肥胖症临床开发阶段

港岛线服务逐步恢复湾仔站障碍物已清除