GLM-5大模型重磅升级支持7大国产芯片平台性能媲美双国际GPU集群

微新创想:春节期间国产AI大模型轮番登场,除了DeepSeek V4还在低调之外,几家热门模型都来了,其中智谱的GLM-5是其中热度最高的之一。从智谱官网介绍来看,GLM-5重点就是提升编程与智能体能力,其参数量达到了7440亿,是上代GLM-4.X的2倍左右,性能提升很明显。此前有海外的AI博主测试其代理编程能力世界第一,综合编程能力世界第三,仅次于Opus 4.6及Gemini 3 Pro,但超越了Opus 4.5。

发布之后由于太受欢迎,导致GLM-5需求暴涨,甚至导致算力不够,用户体验下滑,为此智谱还发布了道歉信,并给出了补偿方案,其能力表现可见一斑。今天智谱还发布了GLM-5大模型的技术报告,特别提到了性能提升主要来自于四大技术创新。

1、引入DSA稀疏注意力机制(DeepSeek Sparse Attention, DSA),极大降低了训练与推理成本。此前的GLM-4.5依赖标准MoE架构提升效率,而DSA机制则使GLM-5能够根据Token的重要性动态分配注意力资源。在不折损长上下文理解和推理深度的前提下,算力开销得以大幅削减。得益于此,智谱将模型参数规模扩展至744B,同时将训练Token规模提升至28.5T。

GLM-5大模型重磅升级支持7大国产芯片平台性能媲美双国际GPU集群插图1

2、构建全新的异步RL基础设施基于GLM-4.5时期slime框架训练与推理解耦”的设计,智谱的新基建进一步实现了生成与训练”的深度解耦,将GPU利用率推向极致。系统支持模型开展大规模的智能体(Agent)轨迹探索,大幅减缓了以往拖慢迭代速度的同步瓶颈,让RL后训练流程的效率实现了质的飞跃。

3、提出全新的异步Agent RL算法该算法旨在全面提升模型的自主决策质量。GLM-4.5曾依靠迭代自蒸馏和结果监督来训练Agent;而在GLM-5中,研发的异步算法使模型能够从多样化的长周期交互中持续学习。这一算法针对动态环境下的规划与自我纠错能力进行了深度优化,这也正是GLM-5能够在真实编程场景中表现卓越的底层逻辑。

4、全面拥抱国产算力生态从模型发布伊始,GLM-5就原生适配了中国GPU生态。智谱已完成从底层内核到上层推理框架的深度优化,全面兼容七大主流国产芯片平台:华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原。据介绍,GLM-5在单台国产算力节点上的性能表现,已足可媲美由两台国际主流GPU组成的计算集群,不仅如此,在长序列处理场景下,其部署成本更是大幅降低了50%。

最新快讯

2026年02月23日

16:06
微新创想:2月23日,中国医学科学院阜外医院药学门诊正式开诊。该门诊专门面向长期服药的患者群体,旨在为他们提供更加专业和细致的用药服务。通过设立药学门诊,医院希望能够更好地满足慢性病患者的用药需求,提高治疗的科学性和规范性。 微新创想:药学门诊所提供的服务包括用药指导、药物治疗管理以及药学监护等多个方面。这些服务不仅帮助患者了解自身用药情况,还能在专业药师的...
16:06
微新创想:据科技媒体消息,苹果软件工程师近日正在内部测试iOS 26.3.1系统。该更新预计将在未来两周内发布,属于一个小幅维护版本,主要针对常规漏洞与安全问题进行修复。此次更新的发布时间点引起了广泛关注,因为它可能与苹果即将举行的春季体验活动紧密相关。 微新创想:活动计划于3月4日北京时间晚10点在纽约、伦敦及上海同步举行,苹果预计将利用这三天时间陆续发布...
16:06
微新创想:2026年春节期间,美团发布的数据显示,全国中低线城市的休闲玩乐订单量同比增长近30%。这一显著增长反映了下沉市场在假期消费中的活跃表现,也显示出越来越多消费者愿意在非核心城市寻找丰富的娱乐和休闲选择。 消费群体主要由年轻人构成,占比超过60%。这表明年轻一代正成为推动休闲玩乐消费增长的重要力量。他们更倾向于探索新鲜事物,追求多样化的娱乐方式,为小...
16:06
微新创想:梅赛德斯-奔驰正在研发一款定位低于G级的全新硬派越野车,这款车型预计将在2027年正式发布。新车将基于专属架构打造,以确保其在性能和操控方面达到高标准。同时,轴距控制在不超过4400毫米的范围内,使整车保持紧凑的车身比例,更适合城市驾驶和复杂地形的挑战。 该车型将推出混动版本,搭载一台1.5升四缸涡轮增压发动机,最大功率可达188马力。混动系统由吉...
15:33
微新创想:2026年2月23日,科技博主Sahil Karoul在迪拜提前购得尚未正式发布的三星Galaxy S26 Ultra手机。这款新机在硬件配置上带来了显著的升级,其中最引人注目的便是其搭载的5000mAh大容量电池,为用户提供了更持久的续航体验。 然而,在实际测试过程中,这款手机的S Pen手写笔却出现了令人意外的功能缺失。S Pen不支持蓝牙连接...
15:33
微新创想:2026年2月23日,独立研究员Nima Owji披露,X平台正低调测试“Made with AI”内容标签功能。该功能位于“内容披露”设置项下,创作者在启用后可以向用户提示其帖文由AI生成。这一举措标志着X平台在AI内容管理方面迈出了重要一步。 据悉,该标签功能在正式上线后,创作者或将被要求主动标记AI生成的内容。若未如实标注,可能会面临内容限流...
15:33
微新创想:截至2026年2月23日,全国电影年度总票房(含预售)突破80亿元大关。这一成绩标志着中国电影市场在经历一段时间的调整后,正逐步恢复活力。数据显示,春节档票房达到53亿元,观影人次突破1亿,这一纪录已连续第八年保持,充分体现了观众对优质影片的持续热情。 微新创想:在年度票房排名中,《飞驰人生3》《惊蛰无声》《镖人:风起大漠》分别位列前三,显示出不同...
15:33
微新创想:2月19日,美国演员埃里克·迪恩因肌萎缩侧索硬化症(ALS)去世,享年53岁。这一消息令全球许多关注罕见病的人感到痛心。埃里克·迪恩作为公众人物,曾通过自己的经历让更多人了解ALS这种被称为“渐冻症”的疾病,也唤起了社会对罕见病研究的重视。 蔡磊当日发文表达遗憾,称未能及时与对方分享六年来的临床经验及新药研发进展。蔡磊是中国ALS患者中最具影响力的...
15:33
微新创想:2026年2月下旬至3月期间 沙特阿美公司向美国雪佛龙 埃克森美孚及印度石油公司出售多批贾夫拉油田凝析油 交易由沙特阿美主导 货物将在上述时间段内装船出口 此举旨在优化出口结构并拓展亚洲与美洲市场客户群 贾夫拉油田是沙特东部省重要的非常规油气产区 近年来持续提升凝析油产能 交易细节未披露价格与数量
15:33
微新创想:2026年2月23日,南京埃斯顿自动化股份有限公司正式通过香港交易所上市聆讯。该公司拟以H股形式在港交所主板挂牌,主承销商为利弗莫尔证券等机构。此举旨在拓展国际融资渠道,加速全球化战略布局。 埃斯顿是国内工业机器人及智能制造核心部件龙头企业,业务覆盖伺服系统、运动控制、工业机器人整机等领域。凭借多年的技术积累和市场拓展,公司已在行业内占据重要地位。...
15:33
微新创想:2月23日13时11分,美国阿拉斯加附近福克斯群岛海域发生6.1级地震。地震发生的具体位置为北纬52.50度、西经170.00度。根据中国地震台网的正式测定,此次地震属于中强震范畴。震源深度约为20千米,表明地震能量释放较为集中。 此次地震发生地为太平洋北部海域,该区域人烟稀少,因此地震对当地居民的影响相对较小。截至目前,官方尚未发布有关人员伤亡的...
15:33
微新创想:2月22日,上海口岸单日查验出入境人员达16万余人次,创历史新高。此次高峰出现在春节假期尾声,是客流集中返程与出境游回升共同推动的结果。 浦东、虹桥国际机场共查验13.3万人次,成为当日出入境人员的主要通道。随着春节假期结束,大量旅客选择在节后返程,同时出境游也逐步回暖,带动了整体客流的增长。 邮轮口岸因双船同靠,当日查验人数达到2.6万人次。这一...