国产AI大模型GLM-5.1登顶开源榜首实现8小时独立编程突破

微新创想:3月底智谱正式推出了GLM-5.1大模型编程能力评分达到45.3分号称仅比全球最强的Opus 4.6低了2.6分这一成绩引发了广泛关注

微新创想:前两天GLM-5.1大模型也正式开源深受开发者喜爱在开源社区中获得了极高的评价

国产AI大模型GLM-5.1登顶开源榜首实现8小时独立编程突破插图1

微新创想:现在最新的排名也来了全球权威AI评测平台LMArena更新了Code Arena专项榜单GLM-5.1登顶全球开源模型第一位列全球模型第三这一排名充分体现了其在代码生成和编程任务中的卓越表现

微新创想:除了榜单表现优秀根据智谱的说法GLM-5.1不仅继承了上一代模型的开源SOTA编码能力还在长程任务Long-Horizon Task上取得突破实现了8小时从零构建Linux桌面655次迭代打破向量数据库优化瓶颈1000轮工具调用优化真实机器学习模型负载等多项突破性成果

微新创想:值得一提的是在METR榜单的同等评估标准下GLM-5.1是唯一达到8小时级持续工作的开源模型也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型

国产AI大模型GLM-5.1登顶开源榜首实现8小时独立编程突破插图2

微新创想:此前智谱提到GLM-5.1大大提高了代码能力在完成长程任务方面提升尤为显著

微新创想:在最接近真实软件开发的SWE-bench Pro基准测试中GLM-5.1刷新了全球最佳成绩超过GPT-5.4和Claude Opus 4.6

微新创想:SWE-Bench Pro要求模型在真实GitHub仓库中定位并修复高难度工程Bug是衡量模型能否胜任专业软件开发的最硬指标这一测试结果进一步证明了GLM-5.1在实际应用中的强大能力

最新快讯

2026年04月11日

12:07
微新创想:4月11日,蔚来汽车董事长李斌在2026智能电动汽车发展高层论坛上指出,电池与芯片合计占整车成本约50%。当前电芯规格不统一、芯片种类繁多且管理复杂,严重制约成本效率与产业响应能力。 他提出推进电芯标准化和芯片架构归一化,预计可为全行业带来超千亿元降本空间。该倡议旨在提升供应链协同效率与长期竞争力。 随着新能源汽车行业的快速发展,电池和芯片作为核心...
12:07
微新创想:4月11日,阿里云在2026智能电动汽车发展高层论坛上宣布,已有超过30家汽车企业及智能驾驶方案提供商在其公共云平台上部署了平头哥自研的“真武”PPU芯片,累计使用量突破10万卡。这是汽车行业在公共云上应用自研AI芯片的最大规模实践。 真武PPU芯片专为智能驾驶场景进行深度优化,相较于通用GPU,在能效比方面表现更优。这一优势使得芯片在处理复杂的智...
12:07
微新创想:4月11日,吉利控股集团董事长李书福在智能电动汽车发展高层论坛(2026)上指出,甲醇具备全生命周期经济性优、使用便捷等优势,是绿色能源在重型交通运输领域应用的重要技术路径。 李书福强调,甲醇能量密度为锂离子电池的十余倍,同等载重下甲醇车整备质量显著低于纯电车,可缓解能耗与续航矛盾。 他进一步认为,中国‘风光氢氨醇’绿色能源体系在交通领域的落地具有...
12:07
微新创想:4月13日,京东将上线名为“Open出发”的新项目。该项目目前在京东APP内设专属入口,用户可以通过该入口了解更多信息。内测区域为山东济南,显示出京东在推进这一项目时采取了逐步推广的策略。 微新创想:京东汽车明确回应称,未开展网约车业务。尽管该项目页面设计类似主流打车应用,但其核心在于不接入第三方运力,而是由京东联合深蓝汽车共同测试。这种模式强调了...
12:07
微新创想:4月11日,中国科学院院士欧阳明高在智能电动汽车发展高层论坛(2026)上指出,纯电驱动汽车技术优势将持续强化,是我国最具全球竞争力的汽车品类。他强调,电动化、智能化、低碳化是实现汽车强国的必由路径。 预计到2030年,我国新能源汽车保有量将达到1亿至1.5亿辆。这一数字将随着技术进步和政策支持不断攀升。到2035年,新能源汽车保有量预计增长至2亿...
12:07
微新创想:2026年4月10日,微软PowerShell团队宣布,自当月发布的PowerShell 7.7-preview.1起,Windows平台将优先采用MSIX替代MSI作为标准安装方式。这一变化标志着微软在软件分发方式上的重要转型。 微软表示,这一调整旨在提升安装过程的可靠性与可预测性。通过引入MSIX声明式模型,安装体验将更加稳定和高效。同时,MS...
12:07
微新创想:4月10日,爱沙尼亚教育部长克里斯蒂娜·卡拉斯表示,该国不支持对儿童实施社交媒体使用禁令。她指出,禁令难以奏效,青少年易绕过限制。 卡拉斯强调,真正责任在于政府与科技公司,呼吁欧盟强化对美企监管。此举与澳、法、西、英等国立法限制儿童使用社交媒体的路径形成对比。 她认为,不应将心理健康等问题归责于儿童自我约束能力,而需系统性治理平台算法与广告机制。这...
12:07
微新创想:4月11日,淘宝闪购联合九州通医疗器械集团在上海国家会展中心发布“玛上就送”医疗健康旗舰店。该店由九州通O2O事业部负责深度运营,标志着国内首个即时零售医疗健康仓体系正式落地。 此举旨在提升药品及医疗器械的小时级配送能力,覆盖买药、健康管理等高频需求场景。通过整合双方资源,淘宝闪购与九州通共同打造更高效的本地化履约网络,为用户提供更快捷的医疗健康服...
12:07
微新创想:2026年4月11日,长安汽车就网络流传的“上百辆网约车频现电池故障、重庆企业状告长安”一事发布声明。公司确认仅收到一家企业针对单一网约运营车辆的起诉,涉事车辆交易主体及环节复杂。 长安汽车强调该事件被严重歪曲夸大,涉嫌以偏概全、干扰司法公正,对此予以强烈谴责,并保留依法维权权利。 公司呼吁公众理性关注,不信谣、不传谣。同时表示将积极配合相关部门调...
12:07
微新创想:4月10日凌晨3时45分,美国旧金山发生一起针对OpenAI CEO山姆·奥尔特曼住所的袭击事件。一名20岁男子向其住所投掷燃烧装置,导致大门附近出现轻微损毁,幸运的是没有人员受伤。警方在接到报警后约27分钟抵达现场,随即展开搜捕行动。大约在凌晨4时12分,警方在第三街1400街区成功拘捕了该嫌疑人。 被捕男子随后在OpenAI旧金山总部(第三街1...
11:36
微新创想:4月9日,Mozilla发布博文批评微软在Windows 11中未经用户同意强制集成Copilot功能。其指出,M365 Copilot自动安装、任务栏固定入口及硬件按键绑定等行为,削弱用户自主权。 Mozilla援引独立报告称,微软长期采用暗黑模式,如搜索强制跳转Edge、跨平台数据迁移后重置默认设置、Outlook/Teams绕过默认浏览器等。...
11:36
微新创想:2026年4月11日,壹号本正式上架迷你AI工作站ONEXStation。这款设备专为高性能计算和AI开发设计,搭载了AMD锐龙AI Max+ 395处理器,为用户提供强大的计算能力。设备配备了128GB LPDDR5-8000内存,确保了高速的数据处理和流畅的多任务操作。同时,1TB SSD的存储空间能够满足用户对大容量数据存储的需求。 微新创想...