国产AI大模型GLM-5.1登顶开源榜首实现8小时独立编程突破

微新创想:3月底智谱正式推出了GLM-5.1大模型编程能力评分达到45.3分号称仅比全球最强的Opus 4.6低了2.6分这一成绩引发了广泛关注

微新创想:前两天GLM-5.1大模型也正式开源深受开发者喜爱在开源社区中获得了极高的评价

国产AI大模型GLM-5.1登顶开源榜首实现8小时独立编程突破插图1

微新创想:现在最新的排名也来了全球权威AI评测平台LMArena更新了Code Arena专项榜单GLM-5.1登顶全球开源模型第一位列全球模型第三这一排名充分体现了其在代码生成和编程任务中的卓越表现

微新创想:除了榜单表现优秀根据智谱的说法GLM-5.1不仅继承了上一代模型的开源SOTA编码能力还在长程任务Long-Horizon Task上取得突破实现了8小时从零构建Linux桌面655次迭代打破向量数据库优化瓶颈1000轮工具调用优化真实机器学习模型负载等多项突破性成果

微新创想:值得一提的是在METR榜单的同等评估标准下GLM-5.1是唯一达到8小时级持续工作的开源模型也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型

国产AI大模型GLM-5.1登顶开源榜首实现8小时独立编程突破插图2

微新创想:此前智谱提到GLM-5.1大大提高了代码能力在完成长程任务方面提升尤为显著

微新创想:在最接近真实软件开发的SWE-bench Pro基准测试中GLM-5.1刷新了全球最佳成绩超过GPT-5.4和Claude Opus 4.6

微新创想:SWE-Bench Pro要求模型在真实GitHub仓库中定位并修复高难度工程Bug是衡量模型能否胜任专业软件开发的最硬指标这一测试结果进一步证明了GLM-5.1在实际应用中的强大能力

最新快讯

2026年04月11日

11:03
微新创想:2026年4月11日,京东生鲜在广东清远正式落地跑步鸡认证基地。这一举措标志着京东生鲜与清远市在农产品品质提升与品牌建设方面迈出了重要一步。 双方联合清远市农业农村局共同制定《京东清远鸡企业标准》,该标准覆盖了选种、养殖、加工、履约等全链条环节。标准中明确了原种、散养、足龄、运动、无抗及可溯源等关键要求,为清远鸡的品质保障提供了坚实依据。 此次合作...
11:03
微新创想:2026年4月10日,汽车媒体Quattroroute发布保时捷911 GT3 Sport Cabriolet实车图。该车为GT3系列首款软顶敞篷车型,采用专属空气动力学套件,含前轮拱导流孔与中置双出排气。外观延续标准GT3设计,仅后引擎盖因软顶收纳结构略显厚实。 动力搭载4.0升自然吸气水平对置六缸发动机,匹配6速手动变速箱,最大功率518马力,...
11:03
微新创想:OPPO Find X9 Ultra橙色版近日曝光了渲染图,消息源@RODENT950在X平台发布了相关图片,引发了广泛关注。据悉,这款新机将在2026年4月21日19:00的OPPO×哈苏影像新品发布会上正式亮相,届时将带来全新的视觉体验和影像技术。 新机延续了OPPO Find X系列一贯的高端设计风格,采用单色机身设计,整体外观简洁大气。机身...
11:03
微新创想:4月11日,圆通速递与中航西飞民用飞机公司在横琴粤澳深度合作区签署HH-200大型支线无人机合作协议。此次合作标志着双方在低空物流领域迈出了重要一步。 微新创想:双方将聚焦低空物流领域,联合推进干支线无人机在运输场景的应用落地。合作内容涵盖运营模式探索、航线规划及实际运行验证等多个方面。 微新创想:通过此次合作,圆通速递与中航西飞民用飞机公司希望加...
11:03
微新创想:2026年4月11日起 长三角铁路正式实施第二季度列车运行图 本次调图覆盖上海、江苏、浙江、安徽三省一市 大幅优化区域铁路运输网络 新增上海虹桥至兰溪东等客运线路 为旅客提供更多出行选择 客货列车开行数量分别达到1433.5对和1380.5对 创下历史新高 货运方面增开11列班列 跨局班列通达23个省份 运输覆盖范围进一步扩大 重点提升宁启、衢宁铁...
10:33
微新创想:4月11日,在智能电动汽车发展高层论坛(2026)上,国家制造强国建设战略咨询委副主任、工信部原副部长苏波指出我国新能源汽车发展仍面临多重挑战 首先技术迭代速度不断加快,导致企业在研发和应用上面临更高要求。核心环节仍存在“卡脖子”短板,制约了整体技术进步和产业升级 其次全球竞争日益激烈,新能源汽车产业面临更大的外部压力。各国纷纷加大投入,推动本国产...
10:33
微新创想:2026年4月11日,OpenAI发布公告称,识别出第三方库Axios存在安全问题,属行业性事件。该问题可能影响到使用Axios的多个应用程序,因此OpenAI决定采取行动以确保其平台的安全性。 公司经全面核查,未发现用户数据泄露、系统遭入侵或软件被篡改的情况。尽管如此,OpenAI仍高度重视潜在的安全隐患,并决定升级其安全认证机制,以进一步加强m...
10:33
微新创想:4月10日,开源电子书管理软件Calibre正式发布9.7版本。该版本新增HTTPS加密的离线内容服务器模式,支持无网络环境访问本地书库。 微新创想:注释浏览器支持按任意字段分组,电子书查看器优化触控板双指缩放手势,默认调整字体大小。 微新创想:修复注释及阅读进度保存失败、搜索链接失效、Linux下MTP设备崩溃等关键问题。 微新创想:新增Ceni...
10:33
微新创想:4月10日,博世宣布已累计交付1000万套基于高通骁龙座舱平台的车载电脑,较百万量级增长仅用不到3年。此举标志着汽车智能化进程加速。 博世与高通同步宣布扩大ADAS领域合作,将基于骁龙Ride平台开发覆盖入门至高级自动驾驶的车载计算机,首批车型预计2028年量产。 同时依托骁龙Ride Flex舱驾一体SoC,打造高集成度高性能计算系统。这一系统将...
10:33
微新创想:2026年4月11日,九州通医药集团与宁夏固原市在固原签署战略合作框架协议。此次合作标志着双方在中医药产业领域迈出了重要一步。 微新创想:根据协议内容,双方将围绕‘固十味’道地中药材产业升级、医药供应链体系建设及智慧医疗服务等多个方面展开深入合作。这一系列举措将为固原市中药材产业注入新的活力。 微新创想:合作的核心目标是推动中药材种植、加工、销售以...
10:33
微新创想:2026年4月9日,韩国蔚山,HD现代重工成功建造全球首批氨动力船舶。这一里程碑事件标志着航运业在实现零碳排放方面迈出了重要一步。 该船由比利时Exmar LPG France公司于2023—2024年订购,共四艘。本次交付的是前两艘——‘安特卫普号’和‘阿尔隆号’,计划分别于2026年5月和7月完成交付。这两艘船舶的建造不仅体现了技术上的创新,也...
10:33
微新创想:4月10日,国际汽车联合会(FIA)召开紧急会议,针对2026年F1新混动规则缺陷启动整改。此次会议的重点是解决新规实施后出现的技术问题和比赛公平性争议。 新规中规定电机的峰值功率为350千瓦,而电池容量仅4兆焦。这一设定在排位赛中引发了显著的能量管理挑战。由于电机功率在200至750千瓦之间剧烈波动,车手不得不依赖复杂的算法来管理能量使用,这在一...