智谱GLM-5.1高速版发布 400tokens/s刷新全球API速度极限

微新创想:5月22日,智谱(02513.HK)在资本市场与技术端同步引爆行业。伴随其港股盘中一度飙升超22%、市值站稳4500亿港元关口,智谱官方正式面向企业客户上线了重磅新品——GLM-5.1高速版 API(GLM-5.1-highspeed)。该模型在保留旗舰大模型完整基座能力的前提下,实测输出速度达到了惊人的 400tokens/s(每秒输出400个标记),一举刷新了当前全球大模型厂商官方 API 的速度上限。

这一速度意味着:一位创作者连续伏案数天才能码出的文字量,它在1分钟内便能交付完毕;原本需要工程师敲键盘3天的系统重构任务,它在一杯咖啡的时间里就能彻底跑完。

核心看点:打破惯例: 过去行业普遍默认“快意味着模型小/轻量级”,智谱首次在国产大模型中实现了**“旗舰级全尺寸能力”与“极致低延迟”**的完美并存。

硬核战绩: 输出速度达400tokens/s,支持 200K 超长上下文窗口,最大单次输出达128K 标记。

底层黑科技: 由智谱 GLM 团队与 TileRT 团队深度联合打造,重构了系统级推理生态。

定向公测: 现已通过智谱 MaaS(大模型即服务)开放平台向部分特定企业客户定向开放。

“即问即答”有多爽?对速度敏感型场景的“降维打击”在过去的一年里,国内大模型的 Coding(编程)和 Agent(智能体)协作能力突飞猛进,但“速度”始终是长链路、高频交互任务下的核心瓶颈。

智谱官方指出,大模型从“工具”演变为“实时伙伴”,400tokens/s 的体感是颠覆性的:AI 编程(Coding Agent): 传统的智能体编程往往需要经历几十轮的跨文件调用与长文本对齐。单轮响应若卡顿几秒,整体任务就会拉长到十几分钟。在高速版加持下,写代码如同开启10倍速,函数、接口与底层调用链随着用户键盘敲击同步瞬时展开,大型工程重构无需任何空等。

实时交互与3D游戏: 极低延迟让模型能够完美胜任游戏世界内的实时动态生成、网页 UI 的即时构建,能够跟随用户的连续输入,毫无滞后地改变系统状态与界面反馈。

商业决策集群: 在多智能体(Multi-Agent)并行推演、实时大数据分析场景下,高速版支持“30秒内完成复杂网页 Agent 集群的多人格并行应答”,大幅拉高了高频量化与推演的效率天花板。

无缝实时语音: 在 AI 陪练、智能客服场景中,极速响应能让语音识别(ASR)到合成(TTS)的链路延迟无限趋近于零,带来真正对等、自然的人类对话流。

拆解三层黑科技:400tokens/s 是如何炼成的?这一全球速度纪录的诞生,核心在于智谱 GLM 团队与 TileRT 团队 联合打造的系统级工程优化。400tokens/s 不是一个好看的“瞬间峰值”,而是一个稳定可用的生产级能力,其底层优化逻辑分为三个层面:

[基础设施层:集群/负载均衡协同] ──► [调度系统层:动态批处理 & KV Cache 调度] ──► [推理引擎层:TileRT 架构重写核心路径] ──►400tokens/s 稳定输出

推理引擎层(TileRT 深度定制): 针对 GLM-5.1独有的网络架构特点,团队彻底重写了最核心的推理路径与底层算子,让单张显卡(GPU)的吞吐能力和硬件执行效率逼近物理极限。

调度系统层(智能合并): 引入了极为激进的动态批处理(Dynamic Batching)、请求合并技术以及颠覆性的 KV 缓存(KV Cache)调度优化,彻底解决了高并发、多用户调用状态下,传统模型极易出现的拖尾延迟(Tail Latency)现象。

基础设施层(集群协同): 围绕推理集群的组网部署、网络链路拓扑以及超高频负载均衡进行了全方位的硬件级协同调优,确保算力在整条流水线上无损传递。

行业重估:AI 下半场是“价值与时间”的清算正如瑞银等国际顶级分析机构近期在港股科技论坛上所强调的:这一轮 AI 驱动的行业重估,与移动互联网时代的“流量与时长变现”本质不同。AI 的收费和生存哲学,不是为了把用户耗在软件里,而是“帮用户和企业省时间、提效率,并从创造的实际价值中进行分账”。

智谱 GLM-5.1高速版的推出,完美踩在了这个逻辑的痛点上。它通过将单次 Token 的产出成本与时间成本压缩到原来的数分之一,让企业在部署高频多 Agent 系统时,不再需要在“要高智能(选大模型却很慢)”和“要速度(选小模型却很笨)”之间做痛苦的妥协。

随着智谱在 MaaS 平台上的定向铺开,这一低延迟、高智能的“生产级 AI 能力”,无疑将加速国内软件生态、自动化编程及游戏产业向全面“Agentic(智能体化)”时代的迭代升级。

最新快讯

2026年05月22日

15:56
声明:本文来自于微信公众号 窄播,作者:李威 庞梦圆,授权站长之家转载发布。这届618大促,AI成了一种更具确定性的行业趋势。5月18日,京东宣布今年的618将于5月30日正式开启,「AI将首次全场景、全产业融入这次大促」——不仅出现在用户的购物链路里,还渗透进物流、仓储、供应链等产业环节。5月11日,千问与淘宝宣布全面打通。用...
15:56
微新创想5月22日消息,博主超维界在社交平台发布爆料,华为Mate系列年度旗舰将在今年9月份集中亮相,这次Mate系列产品线不再是四款机型,直接扩容到六款产品。完整阵容包含Mate 90、Mate 90 Pro、Mate 90 Pro Max、Mate 90 RS非凡大师、Mate X8折叠屏、Mate XT2三折叠屏。全价位段...
15:56
微新创想:过去几年,618活动周期越拉越长,但也越来越难让人兴奋。特价、秒杀常年在线,大促的吸引力难免有所衰减。但今年618不一样。看各平台在大促前的一系列动作以及近期的发布会,大家注意力更多都在AI——阿里宣布千问与淘宝全面打通,AI成为购物新入口,用户可直接千问完成商品挑选、对比及下单购买,同时也可在淘宝APP使用“千问AI购物助手”。京东在618启动发...
15:56
微新创想:5月22日博主智慧皮卡丘透露REDMI K100将搭载骁龙8 Elite Gen5芯片甚至有可能两款都搭载该芯片维持住3000-4000元档的定位 在行业大背景下这次新机涨价成为必然而K系列作为走量旗舰自然也有所取舍不过爆料称其涨幅会低于同级别竞品 REDMI K100系列还会维持前代的超级像素屏幕这未来也会成为小米旗舰的标配通过真RGB排列来实现...
15:56
微新创想:联想集团今日发布2025/26财年全年及第四财季业绩,营收与利润双双远超市场预期。财报发布后,联想股价从前一交易日的13.20港元快速拉升,股价盘中暴涨18.63%,创逾26年新高。这份被称为史上最强的财报有多强,第四财季营收近1500亿元人民币,同比增长27.1%,创近20个季度最高增速;调整后净利润同比翻番,按香港财务报告准则口径的净利润更是去...
15:56
微新创想:5月20日,山东日照。一块警示牌,因为一对老夫妻,被连夜换了内容。原本牌子上写的是“禁止摘花”。因为之前有人恶意摘花、践踏花坛,花主人才立了这块牌。但那天,花主人庄女士看到了一幕:一位老爷爷,拿着剪刀和袋子,小心翼翼地摘花,送给身旁的老伴。 庄女士被触动了。“他们不是恶意破坏,是拿回去插着养。”她第一反应是:“如果我们老了,还有没有人能陪我们一起摘...
15:45
微新创想:2026年5月,Adecco Group发布《人工溢价:算法之外的领导力》报告。该研究覆盖13国2000名企业高管,显示45%的领导者预计AI智能体将在未来12个月内融入工作流程。 然而,仅36%的企业人才战略明确体现AI对员工的发展机遇。这表明尽管AI技术在企业中被广泛讨论,但其在人才发展方面的实际应用仍存在较大差距。 仅22%的领导者对其组织培...
15:45
微新创想:2026年5月,AI硬件研发商Hark宣布完成7亿美元A轮融资。本轮融资由Parkway Venture Capital领投,Salesforce、高通、英特尔投资、博枫、AMD及英伟达等多家全球科技巨头跟投。此次融资标志着Hark在AI硬件领域获得了重要认可,进一步巩固了其在行业内的地位。 Hark专注于AI与物理世界交互的硬件创新,核心业务为个...
15:45
微新创想:2026年5月,玛氏北京怀柔巧克力工厂迎来在华发展三十周年。这座工厂是大陆首批现代化巧克力工厂之一,自成立以来一直致力于本土化投入,持续推动巧克力产业在中国的发展。它不仅承载着玛氏品牌在中国市场的深厚根基,也见证了中国巧克力消费市场的不断成熟与壮大。 微新创想:该工厂主要生产德芙、M&M'S、士力架等多个知名巧克力品牌,凭借先进的生产设备与...
15:45
微新创想:5月21日,奥翔药业(SH603229)发布公告,董事会秘书应晓晨因个人原因辞去相关职务,辞职后将不再担任公司任何职位。公司法定代表人、董事长兼总经理郑志国将暂时代理董事会秘书职责,直至新的董事会秘书人选正式聘任。 应晓晨出生于1981年,拥有硕士学位,具备丰富的境内外金融及企业工作经验,累计超过19年。2025年,其税前薪酬为73.35万元,显示...
15:45
微新创想:上海航运交易所于5月22日公布了最新的集装箱运价指数数据。数据显示,上海出口集装箱运价综合指数报2218.15点,相比上一期上涨了77.49点。与此同时,中国出口集装箱运价综合指数也有所上升,达到1317.36点,环比涨幅为2.9%。 此次运价上涨主要受到国际航线供需关系趋紧的影响。随着全球经济活动的逐步恢复,海运需求持续增长,而运力供应未能及时跟...
15:45
微新创想:2026年5月22日,甘肃至浙江特高压直流输电工程受端配套工程首条送出线路——换流站至宁波500千伏线路全线贯通。这条线路位于浙江省境内,由国家电网建设实施,是连接甘肃与浙江的重要能源通道。 该线路的主要功能在于实现电压转换与并网接入,为甘肃输送的清洁能源提供稳定可靠的接入路径。作为甘浙特高压直流输电工程的重要组成部分,它在推动清洁能源跨区域输送方...