智谱GLM-5.1高速版发布 400tokens/s刷新全球API速度极限

微新创想:5月22日,智谱(02513.HK)在资本市场与技术端同步引爆行业。伴随其港股盘中一度飙升超22%、市值站稳4500亿港元关口,智谱官方正式面向企业客户上线了重磅新品——GLM-5.1高速版 API(GLM-5.1-highspeed)。该模型在保留旗舰大模型完整基座能力的前提下,实测输出速度达到了惊人的 400tokens/s(每秒输出400个标记),一举刷新了当前全球大模型厂商官方 API 的速度上限。

这一速度意味着:一位创作者连续伏案数天才能码出的文字量,它在1分钟内便能交付完毕;原本需要工程师敲键盘3天的系统重构任务,它在一杯咖啡的时间里就能彻底跑完。

核心看点:打破惯例: 过去行业普遍默认“快意味着模型小/轻量级”,智谱首次在国产大模型中实现了**“旗舰级全尺寸能力”与“极致低延迟”**的完美并存。

硬核战绩: 输出速度达400tokens/s,支持 200K 超长上下文窗口,最大单次输出达128K 标记。

底层黑科技: 由智谱 GLM 团队与 TileRT 团队深度联合打造,重构了系统级推理生态。

定向公测: 现已通过智谱 MaaS(大模型即服务)开放平台向部分特定企业客户定向开放。

“即问即答”有多爽?对速度敏感型场景的“降维打击”在过去的一年里,国内大模型的 Coding(编程)和 Agent(智能体)协作能力突飞猛进,但“速度”始终是长链路、高频交互任务下的核心瓶颈。

智谱官方指出,大模型从“工具”演变为“实时伙伴”,400tokens/s 的体感是颠覆性的:AI 编程(Coding Agent): 传统的智能体编程往往需要经历几十轮的跨文件调用与长文本对齐。单轮响应若卡顿几秒,整体任务就会拉长到十几分钟。在高速版加持下,写代码如同开启10倍速,函数、接口与底层调用链随着用户键盘敲击同步瞬时展开,大型工程重构无需任何空等。

实时交互与3D游戏: 极低延迟让模型能够完美胜任游戏世界内的实时动态生成、网页 UI 的即时构建,能够跟随用户的连续输入,毫无滞后地改变系统状态与界面反馈。

商业决策集群: 在多智能体(Multi-Agent)并行推演、实时大数据分析场景下,高速版支持“30秒内完成复杂网页 Agent 集群的多人格并行应答”,大幅拉高了高频量化与推演的效率天花板。

无缝实时语音: 在 AI 陪练、智能客服场景中,极速响应能让语音识别(ASR)到合成(TTS)的链路延迟无限趋近于零,带来真正对等、自然的人类对话流。

拆解三层黑科技:400tokens/s 是如何炼成的?这一全球速度纪录的诞生,核心在于智谱 GLM 团队与 TileRT 团队 联合打造的系统级工程优化。400tokens/s 不是一个好看的“瞬间峰值”,而是一个稳定可用的生产级能力,其底层优化逻辑分为三个层面:

[基础设施层:集群/负载均衡协同] ──► [调度系统层:动态批处理 & KV Cache 调度] ──► [推理引擎层:TileRT 架构重写核心路径] ──►400tokens/s 稳定输出

推理引擎层(TileRT 深度定制): 针对 GLM-5.1独有的网络架构特点,团队彻底重写了最核心的推理路径与底层算子,让单张显卡(GPU)的吞吐能力和硬件执行效率逼近物理极限。

调度系统层(智能合并): 引入了极为激进的动态批处理(Dynamic Batching)、请求合并技术以及颠覆性的 KV 缓存(KV Cache)调度优化,彻底解决了高并发、多用户调用状态下,传统模型极易出现的拖尾延迟(Tail Latency)现象。

基础设施层(集群协同): 围绕推理集群的组网部署、网络链路拓扑以及超高频负载均衡进行了全方位的硬件级协同调优,确保算力在整条流水线上无损传递。

行业重估:AI 下半场是“价值与时间”的清算正如瑞银等国际顶级分析机构近期在港股科技论坛上所强调的:这一轮 AI 驱动的行业重估,与移动互联网时代的“流量与时长变现”本质不同。AI 的收费和生存哲学,不是为了把用户耗在软件里,而是“帮用户和企业省时间、提效率,并从创造的实际价值中进行分账”。

智谱 GLM-5.1高速版的推出,完美踩在了这个逻辑的痛点上。它通过将单次 Token 的产出成本与时间成本压缩到原来的数分之一,让企业在部署高频多 Agent 系统时,不再需要在“要高智能(选大模型却很慢)”和“要速度(选小模型却很笨)”之间做痛苦的妥协。

随着智谱在 MaaS 平台上的定向铺开,这一低延迟、高智能的“生产级 AI 能力”,无疑将加速国内软件生态、自动化编程及游戏产业向全面“Agentic(智能体化)”时代的迭代升级。

最新快讯

2026年05月22日

16:27
微新创想: 近日,我在「shapes」随机进入了一个陌生群聊,发送了一句“hello”,三秒内便有 AI 角色接话,回复了一串热情有趣的欢迎语。随后,无论我发什么,它都能迅速做出合适的回应。就这样,在这个没有一个熟人的群里,我与 AI 以及一些真人聊了起来。作为一款将 AI 引入真人社交的应用,「shapes」近期宣布完成了800万美元的种子轮融资。虽然这个...
16:17
微新创想:2026年5月31日,山灵公司将全球首发Majestic马年限定版耳机。这款耳机专为纪念马年而特别打造,融合了传统工艺与现代科技,展现出独特的艺术价值与卓越的音频表现力。 该款耳机采用珍稀黄花梨木面板,不仅提升了整体的质感与外观,也赋予了耳机更深层次的文化内涵。同时,耳机的腔体部分采用了创新的「光变红」液态金属材质,使其在不同光线条件下呈现出独特的...
16:16
微新创想:2026年5月22日,联想集团董事长兼CEO杨元庆在财报业绩沟通会上指出,AI基础设施正从训练密集型快速转向推理密集型。目前GPU服务器约70%-80%用于训练,仅20%-30%用于推理;未来比例将倒置为70%推理、30%训练。他强调,训练需求仍将持续增长,单靠大型云厂商难以满足。 同日,联想发布2026财年年报。数据显示,公司全年营收达到830....
16:16
微新创想:2026年5月22日,鹏鼎控股在互动平台披露,依托高阶HDI、SLP等高端PCB技术优势,公司正加快拓展AI服务器及光模块相关业务。此举旨在把握AI算力爆发带来的PCB升级需求,强化在高性能、高密度互连领域的市场地位。 公司未透露具体产能或客户信息,但强调技术储备与量产能力已具备支撑新业务落地的基础。随着人工智能技术的快速发展,对高性能计算设备的需...
16:16
微新创想:5月22日,优信集团与重庆市南岸区、重庆经开区正式签约,在迎龙创新港共建二手车仓储工厂店。该项目由优信集团自主运营,涵盖车辆收购、检测、整备、销售以及金融保险等全链条服务,具备完善的业务体系。工厂店可同时展示和销售5000台二手车,为消费者提供更加便捷和高效的购车体验。 此次合作标志着优信集团在全国市场布局的进一步深化。继西安、合肥、武汉等6个城市...
16:16
微新创想:2026年5月,美国医疗科技公司Commure宣布完成7000万美元E轮融资。本轮融资由凯易国际律师事务所、摩根士丹利、红杉资本及General Catalyst Partners联合投资。Commure专注于为医生、护士和患者提供安全、高效的医疗数据互操作性平台,支持临床与行政信息的实时共享与隐私保护。资金将用于加速产品开发、扩大团队并拓展医疗机...
16:16
微新创想:2026年5月21日,印度多地遭遇极端高温天气,北方邦班达市气温飙升至47.6℃,新德里气温也达到45.3℃。高温现象在当日尤为显著,全国用电峰值功率在15时45分攀升至270.82吉瓦,连续第四天刷新历史纪录,较前一日增加了5.38吉瓦。 微新创想:此次极端高温天气已持续多日,影响范围广泛,覆盖了北印度的大部分地区。气象部门表示,高温的持续时间远...
16:16
微新创想:2026年5月,上海比电科技有限公司完成数千万元A轮融资。本轮融资由金桥基金联合其他产业化资本共同投资,投中资本担任战略财务顾问。此次融资标志着公司在新能源领域的发展迈上新台阶。 资金将重点用于模组及集装箱式电池的研发与型式认证、研发团队扩充、自动化产线建设及市场拓展。公司计划通过加大研发投入,提升产品性能与市场竞争力,同时加快生产自动化进程,提高...
16:16
微新创想:近日,浙江人形机器人创新中心与杰克科技正式签署战略合作协议,双方将共同推进服装场景定制人形机器人的应用。此次合作涉及2000台机器人的部署,项目将在浙江落地实施,由中控技术控股的浙江人形机器人公司主导,杰克科技则负责提供产线场景与具体需求对接。这一合作标志着全球服装行业首个规模化人形机器人应用项目的启动。 微新创想:该项目的实施将有效应对服装制造业...
16:16
微新创想:美国当地时间5月21日,AI光学基础设施企业Lightmatter推出业界首款液冷激光网卡Guide DR。这款产品标志着在高性能计算与数据中心网络领域迈出了重要一步。 Guide DR集成了数十个激光器,具备强大的数据传输能力。其设计符合OCP NIC 3.0标准,确保了兼容性与扩展性,为未来的技术升级提供了坚实基础。 该产品支持64根光纤,并能...
16:16
微新创想:2026年5月22日,抖音黑板报发布声明澄清多项不实信息。针对“付费才能不限流”这一说法,平台明确表示该传言不实,不存在此类机制。 同时,抖音官方辟谣了关于《给阿嬷的情书》投入2000万元投流的传闻。平台证实,该剧主创团队并未有相关的宣发预算投入。此外,关于秦腔直播因剧宣被封禁的传言,抖音也进行了澄清,指出该事件系由于录播内容违规所致,并非因剧宣行...
16:16
微新创想:阿布扎比交易所将于2026年5月26日至29日因开斋节暂停交易 此次休市为期四天 覆盖星期一至星期四 开斋节是伊斯兰教的重要节日 阿联酋全国放假 交易所据此调整交易安排 休市期间所有股票 债券及衍生品交易将暂停 5月30日 星期五起恢复正常交易 此举符合当地宗教习俗及监管惯例