阿里通义千问Qwen3-30B-A3B-Thinking-2507模型推理能力大幅提升

Qwen3-30B-A3B模型迎来重大突破性升级,全新版本Qwen3-30B-A3B-Thinking-2507正式发布。这一升级不仅在推理能力、通用性能及上下文处理长度上实现跨越式提升,更标志着该模型在保持轻量化的同时,思考深度和广度得到显著增强。与4月29日开源的Qwen3-30-A3B版本相比,新模型在多个核心维度上展现出更卓越的表现。

在数学能力方面,Qwen3-30B-A3B-Thinking-2507在AIME25专业评测中取得85.0的优异成绩,这一成绩不仅超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)等主流对手,更彰显了其在数学推理领域的强大实力。在代码能力测试LiveCodeBench v6中,新模型同样斩获66.0的高分,充分证明其在编程领域的卓越表现。值得注意的是,新模型在知识水平方面也实现了显著跨越,在GPQA和MMLU-Pro等权威评测中,知识储备和运用能力较上一版本大幅提升。

除了在数学和代码能力上的突破,Qwen3-30B-A3B-Thinking-2507在通用能力方面也实现了全面跃升。在写作能力(WritingBench)评测中,新模型表现突出;在Agent能力(BFCL-v3)测试中展现出更强的任务执行能力;在多轮对话和多语言指令遵循(MultiIF)等通用场景下,新模型均超越Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)等竞品,充分证明其在自然语言理解和生成方面的卓越能力。

阿里通义千问Qwen3-30B-A3B-Thinking-2507模型推理能力大幅提升插图1

新模型的上下文理解能力也得到革命性增强,原生支持高达256K tokens的上下文长度,并可扩展至1M tokens。这一改进使得模型能够处理更长的文本输入,从而更精准地理解和生成复杂文本内容。值得一提的是,新模型的思考长度(thinking length)也相应增加,开发团队特别建议在处理高度复杂的推理任务时,适当延长思考预算以充分发挥其强大潜力。

为了方便开发者和研究人员使用和测试这一全新版本,Qwen3-30B-A3B-Thinking-2507已在魔搭社区和HuggingFace平台全面开源。其轻量化的体积特性,使得开发者可以轻松在消费级硬件上进行本地部署。同时,开发团队也在Qwen Chat应用中同步上线了新模型,诚邀广大开发者前往体验其强大的推理和内容生成能力。

最新快讯

2026年03月04日

09:31
针对日益严重的AI使用安全性及心理健康争议,OpenAI于当地时间 3 月 3 日宣布,将在ChatGPT中引入一项名为“可信联系人”的新功能。该功能允许成年用户指定一位紧急联系人,当系统检测到用户在使用聊天机器人过程中出现心理健康危机时,将自动向其发送警报通知。这一功能的推出背景颇为沉重。据不完全统计,OpenAI目前正面临至少 13 起独立的消费者安全诉...
09:31
中国大模型正在全球开发者社区掀起一场名为“性价比”与“工程化”的狂暴飓风。2026 年 3 月 3 日,根据全球最大的 API 聚合平台 OpenRouter 的最新数据,国产大模型展现了前所未有的统治力:MiniMax M2.5 的调用量位居全球第一,而排在其后的分别是 Kimi K2.5 和 GLM-5。这一“国产三强”霸榜前三的局面,标志着在 AI 应...
09:31
2026年3月4日,全国人大代表、小米集团董事长兼CEO雷军正式提交五份建议,重点聚焦通用人形机器人、智能驾驶安全、科技公益及人才培养等前沿领域,旨在通过政策与技术标准协同,加速我国AI与智能制造产业的深度融合。雷军在建议中指出,人形机器人作为继智能手机、新能源汽车后的颠覆性产品,正处于从实验室走向产业化的关键期。尽管我国在技术领域具备先发优势,但工艺稳定性...
09:31
继 ChatGPT 和 Claude 网页版相继推出语音交互后,AI 编程领域也迎来了“动嘴”革命。当地时间3月3日,AI 巨头 Anthropic 宣布为其面向开发者的命令行工具 Claude Code 正式引入语音模式。这意味着开发者现在可以跳过键盘,直接通过语音指令让 AI 执行复杂的编程任务。据 Anthropic 工程师 Thariq Shihip...
09:31
Google DeepMind 近日正式发布 Gemini3.1Flash-Lite 预览版,标志着 Gemini3系列中速度最快、性价比最高的成员面世。作为 Gemini2.5Flash-Lite 的迭代产品,新模型在保持每秒超360个 token 的极速输出及5.1秒平均响应时间的基础上,实现了智能水平的显著跨越。根据 Artificial Analys...
09:31
当人工智能掌握了核武器的“发射按钮”,世界会变得更安全吗?伦敦国王学院教授肯尼斯·佩恩的一项最新研究给出了令人不寒而栗的答案。实验显示,在模拟核危机场景中,大语言模型(LLM)更倾向于升级冲突,甚至在 95% 的推演情境中都选择了部署或使用核武器。图源备注:图片由AI生成,图片授权服务商Midjourney这项研究调用了当前全球最尖端的三个 AI 模型:GP...
09:31
谷歌智能家居(Google Home)正迎来一场彻底改变“看家”逻辑的重大升级。2026年3月2日,谷歌家居负责人 阿尼什·卡图卡兰 (Anish Kattukaran) 在社交平台宣布,多项基于 Gemini 大模型的深度优化正式向用户推送。其中最令业界震撼的,是名为 “Live Search(实时搜索)” 的功能。这意味着,你的 Nest 摄像头从此拥有...
09:31
3月3日,阿里巴巴创始人马云与蔡崇信、吴泳铭等核心管理层现身杭州云谷学校,就AI时代的机遇与挑战同师生展开深入交流,释放出阿里巴巴集团及蚂蚁集团全面加码AI战略的明确信号。马云在交流中指出,AI时代的加速到来将对社会产生深远冲击,而青少年群体作为未来的希望,更需具备应对技术变革的能力。此次阿里与蚂蚁两集团管理层罕见聚齐,旨在分享阿里巴巴近期在AI领域的深度洞...
08:39
微新创想:3月4日前,中科院光电所联合多家单位在云南丽江高美古观测站开展星地激光通信试验。此次试验依托自主研制的1.8米地面站,团队成功与地球同步轨道卫星建立稳定激光链路。在40740.96公里的最远距离下,实现了上下行对称1Gbps的双向高速通信。 微新创想:试验过程中,建链仅需4秒,链路连续稳定运行超过3小时。这一突破性表现不仅验证了激光通信在超远距离下...
08:39
微新创想:2026年3月3日,特斯拉柏林超级工厂生产负责人安德烈·蒂里希在领英上发布声明,否认德国《商报》关于该工厂2025年仅生产14.9万辆Model Y以及仅0.74%利润率的报道。蒂里希明确表示,2025年的实际产量已超过20万辆,并且各季度之间呈现出持续增长的趋势。此外,他提到自2022年工厂正式投产以来,累计生产量已突破70万辆。 蒂里希还强调,...
08:39
微新创想:2026年2月27日 瑞典媒体SVD披露 Meta公司正将用户通过Ray-Ban智能眼镜录制的含高度隐私内容的视频传输至肯尼亚内罗毕外包公司Sama进行人工标注 数千名签署保密协议的数据标注员被迫观看西方家庭日常私密画面 这一事件引发了广泛的社会关注和讨论 问题源于AI功能启用后 视频须经Meta服务器处理并转交外包方 而自动打码在复杂光照下频繁失...
08:39
微新创想:近日,有网友在社交平台上发布了一段视频,对山姆超市一款售价37.9元的冰块产品表示质疑,引发广泛热议。这款冰块名为“农夫山泉纯透方冰”,净含量为1.38公斤,价格远高于普通冰块,迅速成为网络讨论的焦点。视频发布后,评论区热闹非凡,部分网友认为价格过高,难以接受;也有不少人表示理解,认为这款冰块有其特殊之处。 这款冰块并非普通冰块,而是专为调酒设计的...