声明:本文源自微信公众号硅星人Pro,作者Yoky,经站长之家授权转载发布。7月23日,阿里通义团队正式推出Qwen3-Coder-480B-A35B-Instruct,这或将成为AI编程领域的里程碑事件。该模型采用480B总参数、35B激活的MoE架构,原生支持256K上下文长度,并可实现扩展至1M token,在Agentic Coding、Browser-Use、Tool-Use三大基准测试中表现卓越,多项评测结果直逼Claude Sonnet-4。与以往需要复杂配置的代码模型不同,Qwen3-Coder真正实现了”一条命令掌控整个代码仓库”的便捷体验。同步开源的CLI工具Qwen Code,让模型如同初级程序员般自主工作——从理解需求到任务拆解,从代码编写到测试调试,全程无需人工逐行干预。这种Agentic Coding模式将大模型转化为可在代码仓库中自主行动的智能体,既能解析自然语言需求,又能调用Git、浏览器、终端等多样化工具。更令人惊喜的是其显著的价格优势。每百万Tokens的输入和输出成本分别仅为4元和16元,约为Claude4的三分之一。同时,阿里云百炼平台推出限时五折优惠,128K-1M长上下文服务享受半价特权。加上完全开源且免费商用的政策,原本高企的AI编程服务正加速走向平民化。许多开发者可能尚未意识到AI Coding的深层价值——它不仅是代码生成的工具,更是AI Agent与物理世界交互的关键底层技术。从这个视角看,Qwen3-Coder的问世标志着AI编程正从”辅助工具”向”自主Agent”实现跨越式发展,而开源+超低价的组合拳,或将推动这一能力快速普及,重塑软件开发规则。我们第一时间完成内测,深度解析其技术细节。实测阶段,我们未选择常见的贪吃蛇、弹球游戏,而是挑战规则更复杂、交互更丰富的围棋对战程序。首次运行时,模型不仅准确遵循围棋基本规则,还完美实现吃子、禁着点等复杂机制(棋子被提走后,当前位置禁止再落子),展现了出色的逻辑理解与实现能力。但这个围棋程序仍显简陋,缺乏胜负判定机制和倒计时功能,整体用户体验有待提升。经过二次指令优化后,模型生成了更完善的界面,甚至主动添加了认输按钮。不过,在围棋深层次规则方面,如”打劫”等高级规则尚未完全实现。随后,我们测试了网页生成能力:Prompt要求生成一页纯HTML+CSS+SVG的梦幻黄色网页,包含径向渐变背景、60颗漂移粒子、5个循环淡入淡出的光晕气泡、中央发光的’Dreamy Lemon’手写字,以及点击柠檬触发爆炸动画的交互效果,主题为柠檬黄+Tiffany蓝。结果模型确实实现了所有技术要求,但在”梦幻”概念的理解上出现偏差,过度渲染模糊效果导致整体视觉失真。物理场景测试中,我们选择了极具挑战性的”三体运动”问题,通过CLI调用Qwen3-Coder评估其Agent能力。Prompt要求实现实时三体运动模拟:黑色全屏背景,3个彩色小球(红、绿、蓝)仅受彼此万有引力作用,需真实模拟运动轨迹;实时计算牛顿万有引力公式F=G·m₁m₂/r²,速度矢量随时间累积;保留800点彩虹渐变轨迹(FIFO,可开关);左上角提供重力常数滑杆、速度倍率滑杆、轨迹显示开关、重置按钮;零依赖、复制即用、双击浏览器即可观看三球持续运动。测试发现,模型在完成编程后主动调用Chrome浏览器工具,在后台自行演示验证,逐项核对需求后才进入最终展示阶段。这表明虽然模型能理解复杂需求,但在将需求转化为可运行代码时,特别是涉及复杂数学计算和实时动画的部分,仍需多工具协同完成。如何让代码能力”内化”于模型?Qwen团队采用创新训练思路:将Agent能力深度集成于训练过程,而非后期附加。通过Agent RL训练,模型掌握了多轮交互、工具调用、错误处理等核心能力,这些能力已”内化”于模型结构中。预训练阶段使用了7.5万亿token数据,其中70%为代码,相当于为模型配备更丰富的编程教材,既强化编程能力,又不牺牲通用语言和数学能力。更关键的是上下文能力突破。模型原生支持256K上下文长度,最多扩展至1M,可同时分析整个项目代码,而非零散片段。同时,团队用Qwen2.5-Coder对训练数据进行”批改作业”,清洗和改写低质量代码,确保数据质量。这种做法体现了从理论学习向实战进阶的转变。传统代码模型主要关注benchmark表现,但Qwen团队在后训练阶段引入执行驱动的强化学习。针对”难写、易验证”的真实任务(单元测试、脚本、小工具)自动生成测试用例,将执行成功率作为奖励信号,让模型在百万量级代码片段中反复试错、自我优化。核心差异在于:不仅让模型写代码,更确保代码能成功运行。通过自动生成大量测试用例,模型可即时验证代码正确性,持续改进。目标从”跑分”转向”可用”。更进一步,真正的Agent能力源于持续实测。团队在SWE-Bench等需要多轮代码修改、测试、Git提交的环境中进行强化学习,这已接近真实开发流程。技术突破在于环境工业化扩展。借助阿里云构建了能同时运行2万个独立编程环境的系统,相当于为模型提供2万个虚拟机进行编程练习。每个环境提供即时反馈,模型像实习程序员一样不断接收CI反馈、修改、再测试,最终在SWE-Bench Verified测试中取得开源模型第一的成绩。在真实场景中训练的Qwen3-Coder,终于突破了AI编程工具普及的最大瓶颈——调试能力。此前AI编程助手普遍存在致命缺陷:代码生成后若出现bug,仍需人工手动排查修复,这对编程经验要求极高,令普通用户望而却步。而Qwen3-Coder具备自我测试和调试能力,真正实现”写完即用”,这意味着编程新手也能借助AI完成复杂开发任务。更关键的是成本优势带来的市场变革。开发过程中通常涉及多轮迭代调试,以往使用Claude4等顶级模型成本高昂,许多中小团队和个人开发者只能望而却步。Qwen3-Coder在保持同等性能水准的前提下,成本仅为三分之一,加上完全开源免费商用,彻底消除了价格门槛。这种性能与价格的完美平衡,正使其快速成为开发者的首选模型。Qwen3-Coder的核心优势不仅在于编程能力本身,更在于其强大的Agent特性。该模型能自主调用各类工具、理解复杂需求、进行多轮交互,这种能力远超传统代码补全工具。然而当前市场对AI Coding的重视程度严重不足。实际上,编程能力是AI Agent的核心基础,是AI与物理世界交互的关键底层技术。当AI能理解需求、编写代码、调用工具、处理异常时,就具备了在现实世界中自主行动的能力。从这个维度看,AI Coding的价值被严重低估。综合来看,Qwen3-Coder堪称全球最具性价比的编程模型。不仅技术性能对标顶级闭源模型,成本控制实现数量级优势,加上完全开源策略,正在重新定义AI编程工具行业标准。当编程门槛被AI彻底降低时,我们看到的是整个软件开发生态正在走向民主化。

Qwen3-Coder开箱即用 AI编程质变节点开源超低价插图

Qwen3-Coder开箱即用 AI编程质变节点开源超低价插图1

Qwen3-Coder开箱即用 AI编程质变节点开源超低价插图2

Qwen3-Coder开箱即用 AI编程质变节点开源超低价插图3

Qwen3-Coder开箱即用 AI编程质变节点开源超低价插图4

最新快讯

2025年07月26日

22:11
2025年7月26日,在世界人工智能大会暨人工智能全球治理高级别会议上,图灵奖得主、中国科学院院士姚期智发表了重要演讲,为与会者描绘了通用人工智能(AGI)时代的到来。姚期智院士指出,AGI的发展速度远超预期,其商业化应用前景广阔,将深刻改变各行各业。他特别强调,AI的安全性问题已成为全球关注的焦点,因为与传统的算法相比,AGI缺乏成熟的理论保障体系,这为潜...
22:11
7月26日20时,受持续强降雨及上游来水叠加影响,我国北方多省河流水位急剧上涨,引发严重洪涝灾害。据水文监测数据显示,内蒙古红河、大黑河及支流小黑河,河北滦河支流蚂蚁吐河,山西永定河支流南洋河,黑龙江松花江支流木兰达河,云南澜沧江支流黑惠江,新疆塔里木河、叶尔羌河等共10条主要河流相继突破警戒水位,其中内蒙古大黑河已超保证水位,河北蚂蚁吐河水位更是创下历史最...
22:11
7月26日,天孚通信在官方互动平台上明确表示,公司目前专注于光通信器件的整体解决方案以及光电先进封装制造服务,尚未涉足CW光源的生产领域。这一官方回应进一步印证了天孚通信在光通信产业链中的专业定位,其业务范围主要集中在光通信器件的研发、生产和封装环节,为客户提供一站式解决方案。公司强调将继续深耕主营业务,不断提升光通信产品的技术含量和品质,致力于为全球客户提...
22:11
2025年7月26日,备受瞩目的2025世界人工智能大会暨人工智能全球治理高级别会议在上海世博中心隆重举行。在这场汇聚全球顶尖AI专家与行业领袖的盛会中,智元机器人联合创始人兼CTO彭志辉先生重磅发布了业界首个具身智能操作系统参考框架——‘智元灵渠OS’的开源计划。这一具有里程碑意义的举措,不仅标志着具身智能技术迈入全新发展阶段,更彰显了智元机器人推动行业生...
22:11
7月25日,备受瞩目的第二届中国品牌汽车海外(智利)展览会于智利首都圣地亚哥列斯科会议中心盛大启幕。此次展会汇聚了奇瑞、福田、徐工、赛力斯等十余家中国汽车领军品牌,全面展示了涵盖燃油车与新能源汽车的尖端产品矩阵,向智利当地市场及消费者呈现了中国汽车产业的创新实力与发展成果。 智利交通电信部负责交通事务的副部长豪尔赫·达萨在开幕式上发表致辞,他高度评价中国...
21:22
微新创想7月26日重磅报道,OPPO正式发布备受期待的OPPO K13 Turbo系列手机,凭借卓越性能和创新技术再次引领市场潮流。该系列首销单日激活量较上一代飙升380%,成为消费者关注的焦点。全新K系列凭借其创新的疾风散热引擎,实现了越级性能突破,同时其满级防水抗摔能力也赢得了广泛认可。 此次发布的OPPO K13 Turbo系列包含两款机型:K13 T...
21:22
7月26日,戴德梁行最新发布的杭州第二季度写字楼市场报告揭示了市场面临的严峻挑战。报告数据显示,杭州写字楼空置率已攀升至27.7%,不仅刷新了历史记录,更反映出市场供需关系的深刻变化。与此同时,租金水平也跌至114.4元/平米/月的冰点,创下历史新低。这一系列数据背后,是杭州甲级办公市场的结构性调整。 随着恒隆广场、嘉里城以及钱江世纪城EIC项目的集中交付,...
21:22
2025年7月26日,德意志银行正式宣布完成业务重组计划,通过优化资产结构与风险控制,显著提升了整体信用状况。为巩固改革成果,银行明确提出将税后平均有形股本回报率(ROTE)作为核心考核指标,并设定不低于10%的长期目标。这一战略举措旨在进一步强化资本实力,确保在复杂市场环境中的稳健运营。 上半年业绩数据显示,德意志银行已提前实现阶段性目标,实际ROTE达到...
21:22
2025年7月,上海浦东新区正式发布《浦东新区生物医药产业园区功能提升方案(2025—2027年)》,这一战略规划旨在将浦东新区打造成为全球创新药械首发地、科学家创新创业首选地和制度改革首创地,标志着该区域在生物医药领域的雄心与决心。方案明确提出,到2027年,浦东新区生物医药产业规模将突破5000亿元大关,这一宏伟目标不仅将进一步巩固其作为中国生物医药产业...
21:22
2025年7月26日,北京市密云区紧急发布暴雨橙色预警,提醒市民高度警惕即将到来的强降雨天气。根据气象部门最新监测数据,预计从当前时段持续至27日凌晨00时,密云区西部及北部地区将迎来强降雨,小时雨强或将突破70毫米大关。更严峻的是,6小时内累计降雨量可能达到100毫米以上,而24小时内累计降雨量或将超过150毫米,呈现出短时强降雨的严峻态势。 此次强降雨过...
21:22
2025年7月26日,光大证券发布了一份深度研报,揭示了稳定币在推动人民币跨境支付基础设施扩展及应用场景多元化方面的重要作用。报告指出,随着数字货币技术的不断成熟,人民币在国际支付领域的应用正迎来前所未有的发展机遇。数据显示,2024年全球零售跨境支付市场规模已达到惊人的39.9万亿美元,这一数字预计到2032年将增长至64.5万亿美元,展现出强劲的增长势头...
20:50
最新消息显示,7月26日一项来自国外研究团队的惊人发现引发了全球关注。该团队在7月份发表的论文中提出大胆假设:今年7月新发现的星际天体3I/ATLAS可能是一艘具有敌意的外星飞船,并预测它将在今年11月对地球发起袭击。据报道,这颗神秘天体正以惊人的速度——超过13万英里每小时——冲向太阳,其直径可能达到15英里(约24公里),属于一颗大型彗星。根据天体运行轨...