GLM-5大模型重磅升级支持7大国产芯片平台性能媲美双国际GPU集群

微新创想:春节期间国产AI大模型轮番登场,除了DeepSeek V4还在低调之外,几家热门模型都来了,其中智谱的GLM-5是其中热度最高的之一。从智谱官网介绍来看,GLM-5重点就是提升编程与智能体能力,其参数量达到了7440亿,是上代GLM-4.X的2倍左右,性能提升很明显。此前有海外的AI博主测试其代理编程能力世界第一,综合编程能力世界第三,仅次于Opus 4.6及Gemini 3 Pro,但超越了Opus 4.5。

发布之后由于太受欢迎,导致GLM-5需求暴涨,甚至导致算力不够,用户体验下滑,为此智谱还发布了道歉信,并给出了补偿方案,其能力表现可见一斑。今天智谱还发布了GLM-5大模型的技术报告,特别提到了性能提升主要来自于四大技术创新。

1、引入DSA稀疏注意力机制(DeepSeek Sparse Attention, DSA),极大降低了训练与推理成本。此前的GLM-4.5依赖标准MoE架构提升效率,而DSA机制则使GLM-5能够根据Token的重要性动态分配注意力资源。在不折损长上下文理解和推理深度的前提下,算力开销得以大幅削减。得益于此,智谱将模型参数规模扩展至744B,同时将训练Token规模提升至28.5T。

GLM-5大模型重磅升级支持7大国产芯片平台性能媲美双国际GPU集群插图1

2、构建全新的异步RL基础设施基于GLM-4.5时期slime框架训练与推理解耦”的设计,智谱的新基建进一步实现了生成与训练”的深度解耦,将GPU利用率推向极致。系统支持模型开展大规模的智能体(Agent)轨迹探索,大幅减缓了以往拖慢迭代速度的同步瓶颈,让RL后训练流程的效率实现了质的飞跃。

3、提出全新的异步Agent RL算法该算法旨在全面提升模型的自主决策质量。GLM-4.5曾依靠迭代自蒸馏和结果监督来训练Agent;而在GLM-5中,研发的异步算法使模型能够从多样化的长周期交互中持续学习。这一算法针对动态环境下的规划与自我纠错能力进行了深度优化,这也正是GLM-5能够在真实编程场景中表现卓越的底层逻辑。

4、全面拥抱国产算力生态从模型发布伊始,GLM-5就原生适配了中国GPU生态。智谱已完成从底层内核到上层推理框架的深度优化,全面兼容七大主流国产芯片平台:华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原。据介绍,GLM-5在单台国产算力节点上的性能表现,已足可媲美由两台国际主流GPU组成的计算集群,不仅如此,在长序列处理场景下,其部署成本更是大幅降低了50%。

最新快讯

2026年02月23日

14:25
微新创想:蚂蚁集团今日披露春节假期实战数据 显示其核心AI业务全面爆发 蚂蚁集团在春节假期期间展现出强劲的AI业务增长势头。数据显示,支付宝AI付用户数突破1亿大关,同时蚂蚁阿福APP的总用户数也正式迈过1亿门槛。在AI技术大规模应用的第一个春节,蚂蚁集团凭借在支付与健康领域的创新表现,成功实现差异化突围。 支付宝AI付在春节假期期间持续发力 用户数突破1亿...
14:25
微新创想:内存价格已经疯狂了小半年,预计还会持续很长一段时间,但是在欧洲,部分DDR5内存居然开始降价了。有网友一直在追踪32GB DDR5内存套装在欧洲的价格,给出了一条奇怪的曲线。去年9月和之前,价格一直很稳定,大约95-100欧元,之后一路飙涨,到上个月已经高达430-470欧元。不过就在最近,价格开始下探了,来到了370-420欧元左右。 另外,To...
14:25
微新创想 在山东,有一座城市,不止有闻名全国的烟火气,还有铺满全城的爱心,堪称最有爱的城市。坐高铁来山东淄博,体验这份独特的浪漫吧! 淄博北站位于淄博市高新区,建成于2018年,是济青高速铁路的中间站之一。淄博北站站前通道酷似一颗巨大的爱心,被大家形象地称为会比心的车站,成为众多游客的打卡地。心型通道作为淄博北站的落客平台,是车站连接室外的过渡空间,融合了风...
14:25
微新创想: 全球爆火、单日股价狂涨42%、被称作全球大模型第一股”的智谱日前发布GLM-5技术报告,公开了全部技术细节,正面回应套壳”蒸馏海外模型”等行业质疑。智谱在报告中指出,GLM-5是一款旨在推动编程范式从VibeCoding”(氛围编程)转向AgenticEngineering”(智能体工程)的下一代基础模型。总体而言,GLM-5能够实现性能的大幅跃...
14:25
微新创想:当地时间周日晚间第79届英国电影学院奖颁奖礼圆满落幕,保罗·托马斯·安德森执导的《一战再战》成为当晚的最大赢家,一举斩获包括最佳影片与最佳导演在内的六座奖杯。这一成绩不仅彰显了影片的艺术价值,也再次证明了导演在叙事与视觉表达上的非凡才华。 最大冷门出现在最佳男主角的角逐中,英国演员罗伯特·阿拉马约凭借《妥瑞氏与我》成功击败甜茶和小李,成为本届BAF...
14:03
微新创想:2026年2月21日,一辆问界M9在广东省惠州市附近发生起火事件。据初步了解,该事件发生在车辆行驶过程中,未造成人员伤亡。目前,相关部门已介入调查,初步判断车辆三电系统状态正常,未发现其他自身异常,因此起火原因暂不明确,不排除外部因素影响。 问界汽车方面表示,将全力配合有关部门开展后续调查工作,确保事件得到全面、公正的处理。同时,公司也承诺将积极协...
14:03
微新创想:2026年3月5日,Nothing公司将发布中端新机Phone (4a)。该机位于手机背面的Glyph通知系统采用6个方形灯,每灯集成9颗独立控制Mini LED,亮度较前代A系列提升40%。新设计应用专利光学技术,实现更自然、中性且无溢色的灯光表现。此举标志着a系列首次弃用沿用多年的3条LED灯带设计,转向模块化方阵布局。Nothing创始人裴宇...
14:03
微新创想:2026年2月23日,摩根大通宣布将空中客车公司股票目标价由240欧元下调至225欧元。此次调整发生在德国及欧洲总部所在地,由摩根大通研究团队作出。 下调主因系对空客近期交付节奏放缓、供应链持续承压及A320系列订单转化不及预期的审慎评估。该行维持“中性”评级,强调短期盈利能见度减弱。 此举反映机构对航空制造业复苏节奏的谨慎态度。随着全球经...
14:03
微新创想:2026年2月23日,全球私募股权公司KKR据悉已同意以13亿美元收购教育机构XCL。交易发生于美国,买方为KKR,卖方信息未披露。此次收购旨在拓展KKR在教育科技及职业培训领域的布局。交易预计将于2026年内完成交割,具体时间及监管审批进展尚未公布。
14:03
微新创想:2026年2月24日,美国国家航空航天局(NASA)计划将执行‘阿耳忒弥斯2号’载人绕月任务的SLS火箭与猎户座飞船,从佛罗里达州肯尼迪航天中心发射台运回装配大楼。此举源于2月19日综合演练后发现过渡型低温推进级氦气供应中断。为查明原因并修复问题,NASA认定回运检修为必要步骤。该任务原定送4名宇航员绕月飞行,尚未确定新的发射窗口。
14:03
微新创想:2月23日12时12分 新疆巴音郭楞州尉犁县发生5.1级地震 此次地震的震中位于北纬40.88度、东经84.17度 震源深度为15千米。根据中国地震台网的正式测定 地震信息已经公布。目前暂无人员伤亡和财产损失的报告 这为地震后的应急处理争取了宝贵时间。 当地应急部门已迅速启动初步响应机制 开展灾情排查工作。相关部门正在对震区进行全面评估 以确保居民...
13:43
微新创想:2027年将成为桌面CPU处理器的重要转折点 AMD与Intel均宣布将下一代产品推迟至明年发布 两家公司都将迎来技术上的重大突破 这意味着消费者将有机会体验到更强大的性能以及更具性价比的产品 微新创想:AMD的Zen6架构代号为Olympic Ridge(奥林匹克山脊) 此次架构升级将带来显著的变化 根据最新消息 锐龙10000系列将作为其命名方...