阿里千问3新模型参数减半推理速度提升10倍

阿里巴巴通义千问团队近日向全球开发者投下了一枚震撼性消息——即将推出的Qwen3-Next-80B-A3B-Instruct模型彻底颠覆了传统大模型的运行逻辑。这个看似矛盾的数字组合背后,隐藏着一项令人瞠目结舌的技术突破:总参数高达80亿,但实际激活的参数仅有3亿,犹如一台超级跑车仅用十分之一的引擎却实现了十倍的速度。就在数小时前,Hugging Face Transformers库悄然完成了一次关键合并操作,相关的PR代码已正式集成到主分支中。这一看似平凡的技术动作,实际上预示着全球无数AI开发者将获得一个前所未有的计算利器,一场开源AI的效率革命正在悄然拉开序幕。

这个全新模型继承了Qwen3系列标志性的A3B设计哲学,但在规模上实现了质的飞跃。当传统大模型还在为庞大的参数量和高昂的计算成本而烦恼时,千问团队选择了一条更加精妙的道路。他们采用了MoE专家混合架构,仿佛在模型内部构建了一个高度专业化的团队,每次仅激活最合适的专家处理特定任务,而其他专家则静默待命。这种设计带来的效果令人惊叹。在处理超过32K长度的上下文时,新模型的推理吞吐量竟然达到了Qwen3-32B的10倍以上。

用户们已迫不及待地分享着他们的测试体验。许多人表示,相比之前常用的Qwen3-30B-A3B系列,这个新模型不仅保持了飞快的推理速度,还展现出更加丰富的知识储备和更强的复杂任务处理能力。

在代码生成领域,这个模型的表现令人瞩目。开发者们发现,它能够以极少的计算资源实现业界领先的效果,无论是复杂的算法实现还是多语言代码转换,都能游刃有余地完成。数学推理和多语言翻译同样是它的强项,这种全面的能力提升让它成为真正意义上的通用智能助手。

更令人振奋的是训练成本的大幅下降。据团队透露,新模型的训练开销还不到Qwen3-32B的十分之一,这意味着更多的研究机构和中小企业将有机会参与到大模型的训练和定制中来。稀疏激活的深度优化不仅降低了资源消耗,还提高了模型的泛化能力和指令跟随性能,让AI变得更加贴近实际应用需求。

阿里千问3新模型参数减半推理速度提升10倍插图1

开源社区对这一消息的反应可以用狂热来形容。无数开发者在各大技术论坛中表达着他们的期待,他们看中的不仅仅是更大的参数规模,更是这种参数更大激活更少的创新设计理念。这种设计让边缘设备和云端部署都能享受到顶级大模型的服务,真正实现了AI技术的民主化。

千问团队一如既往地坚持着开源的初心,新模型将完全开放给全球开发者使用。Instruct变体的支持让它能够轻松应对对话系统、工具调用等实际应用场景,而在视觉美感和结构准确性方面的提升,更是为未来的多模态扩展打下了坚实基础。无论是图像描述还是文档分析,这个模型都展现出了巨大的潜力。

长序列处理能力的质的飞跃让这个模型在处理复杂任务时更加得心应手。相比前代产品,它不仅在效率上实现了突破,在准确性和稳定性方面同样表现出色。这种全方位的提升预计将彻底重塑本地AI部署的格局,让更多的应用场景能够享受到大模型带来的智能化服务。

这一技术突破对整个AI行业的影响是深远的。在资源受限的环境中,高吞吐量和低成本的特性将加速AI技术在移动设备和中小企业中的普及。当计算效率不再是制约因素时,我们可以预见更多创新应用的涌现,AI将真正走进千家万户,成为人们日常生活和工作中不可或缺的智能伙伴。

随着模型的正式发布日期临近,全球的AI开发者们都在屏息以待。这不仅仅是一个新模型的发布,更是开源AI生态系统的一次重要升级。在这场效率革命中,每一个参与者都将成为受益者,而AI技术的边界也将被再次推向新的高度。

最新快讯

2026年03月05日

15:59
声明:本文来自于微信公众号 电商在线,作者:唐果,授权站长之家转载发布。春暖花开的季节,万物复苏的氛围也在美妆圈泛起了涟漪。美妆博主“Benny董子初”(以下简称:董子初)近日在社交平台宣布,“CROXX即将重启”。在CROXX的天猫旗舰店中,也可以发现,以“CROXX”为品牌名的面膜、洗面奶等产品上新,并正在开启预售。这个诞生...
15:59
声明:本文来自于微信公众号 光子星球,作者:郝鑫,授权站长之家转载发布。上市52天后,MiniMax交出了IPO后的首份成绩单。整体来看,2025年MiniMax收入7903.8万美元,较去年同比增长158.9%。剔除掉股份支付、金融负债公允价值变动和上市开支这些项目后,经调整净亏损2.51亿美元,较去年同期亏损扩大了2.7%。...
15:59
声明:本文来自于微信公众号 天下网商,作者:金雅,授权站长之家转载发布。恰巴塔,一种无糖少油的“丑面包”,正在跻身全网顶流美食。“爱吃啥夹啥,万物皆可夹。”近日,一名小红书用户调侃“恰巴塔进入了‘瑜伽裤时代’”——视频中,恰巴塔在平底锅内加热后被随意剪开,塞入黑椒鸡排、红油滑蛋和奶酪,这种中西交融的吃法调动了超10万人的点赞欲,...
15:58
2026年3月5日,诺和新元公布2025财年业绩。公司全年实现7%的有机销售增长。业绩发布于丹麦哥本哈根总部,由公司管理层披露。增长主要源于糖尿病与肥胖症创新产品线的市场拓展及全球准入提升。公司表示,2026财年开局良好,预计全年将延续积极增长态势。此次财报未包含并购影响,聚焦核心业务表现。
15:58
3月3日,无人机飞手Joe Tegtmeyer在X平台发布航拍视频,显示特斯拉得州超级工厂内已有25辆Cybercab处于不同测试阶段:14辆金色版停于出口附近,9辆在碰撞测试区,2辆正进行下线检测,另有多辆自主行驶。首辆生产版已于2月17日下线,较马斯克原定4月计划提前数周。该双座无人驾驶出租车取消方向盘与踏板,依赖纯视觉FSD系统,目标售价低于3万美元...
15:58
3月5日,上海光大证券资产管理有限公司宣布,总经理乔震正式出任董事长。此前自2025年8月起,乔震已代行董事长职责并兼任总经理,同年8月27日完成法定代表人变更登记。乔震2012年加入光证资管,历任多个高管职务,拥有招商银行、华泰柏瑞基金从业经历。公司成立于2012年5月,为国内首家上市券商旗下资管公司。2024年实现营收6.75亿元、净利润2.19亿元,...
15:58
2026年3月,霆升科技宣布完成B+轮融资,由财信产业基金、迪策投资联合投资。该公司专注于心脏电生理介入器械研发,通过超声技术实现导管实时空间定位,并自主研发VR虚拟仿真手术模拟器,用于医生及医学生培训。其技术整合成像、标测与消融能量,提升房颤等心律失常疾病的治疗效果。本轮融资将用于加速产品临床注册、产线扩建及核心技术迭代。
15:58
2026年3月,数字资产交易所Crossover Markets宣布完成3100万美元B轮融资。本轮融资由Tradeweb领投,XTX Markets、Wintermute Ventures、Virtu Financial、Ripple、Illuminate Financial及DRW Venture Capital跟投。该公司总部位于美国,专注于为机构客...
15:58
3月5日,阿里旗下首家线下潮玩店“好运连得 LUCKY LOOP”在北京正式落地。该店由中联盛世文化(北京)有限公司运营,系大麦娱乐间接全资附属公司。店铺定位为IP衍生品集货店,目前处于前期探索与筹备阶段。企业信息显示,该公司已提交多枚“好运连得”“LUCKY LOOP”商标申请,涵盖布料床单、金属材料、厨房洁具等国际分类,均处申请中状态。
15:58
3月5日,半导体流体控制设备制造商智桦半导体宣布完成Pre-A轮融资,由珠海高新投投资。公司总部位于珠海,专注于半导体制造环节的高精度流体控制系统研发与产业化。本轮融资将用于加速核心零部件国产化、产线验证及团队扩充。智桦半导体成立于2021年,已为多家晶圆厂提供定制化流体控制解决方案,技术覆盖刻蚀、沉积等关键制程。此次融资标志着其在半导体专用设备国产替代进...
15:58
2026年3月,美国智能床垫企业Eight Sleep完成5000万美元E轮融资,Tether Investments领投。该公司总部位于旧金山,专注研发集成水力温控与健康追踪功能的睡眠健身产品。本轮融资将用于加速AI睡眠算法研发、扩大全球市场及提升产能。Eight Sleep自2014年成立以来已累计融资超1.2亿美元,产品覆盖美、加、英、德等十余国。此...
15:58
3月5日,智联招聘发布《2026中国女性职场现状调查报告》。调查显示:60.9%的女性求职者曾被问及婚育情况,远高于男性的35.5%;女性职场年龄危机多集中于31-35岁婚育阶段;12.6%女性因性别歧视影响晋升,男性为3.4%;2026年女性平均月薪9299元,较男性低13%。报告基于全国范围职场人群抽样调研,旨在反映当前女性在就业、晋升与薪酬方面的现实...