智谱联合TileRT推出GLM-5.1高速版API刷新全球400tokens/s速度纪录

微新创想:智谱今日正式面向部分企业客户推出GLM-5.1高速版API(GLM-5.1-highspeed)该模型输出速度达到惊人的400tokens/s 成功刷新当前全球大模型厂商API的速度上限

微新创想:打破了行业过去“高性能模型必然带来高延迟”或“高速模型只能是轻量级模型”的惯例 GLM-5.1高速版首次在国产大模型中将旗舰级模型能力与极致低延迟同时带入生产环境 用户无需再为响应速度而牺牲模型质量

微新创想:颠覆传统体验 直击速度敏感场景在长程任务和复杂生产环境中 速度的提升带来了产品形态的质变

微新创想:AI编程(Coding Agent)在完整保留GLM-5.1强大能力的基础上 新模型实现“即问即答”模型能一边理解工程上下文 一边持续生成代码与修改方案 在需要数十轮调用的重构项目中 彻底消除了累计数分钟的空等

微新创想:实时动态建模在3D地图实测中 玩家控制角色移动并输入文字 模型能够瞬时完成建模并实时改变场景

微新创想:Agent Swarm并行调度在长程任务中 模型可在30秒内完成复杂网页处理 并能瞬间调度50个不同人格并行回答 展现出新型操作系统的雏形

智谱联合TileRT推出GLM-5.1高速版API刷新全球400tokens/s速度纪录插图1

微新创想:核心技术揭秘GLM-5.1高速版400TPS的稳定生产级能力 得益于智谱GLM团队与TileRT团队联合进行的系统级优化

微新创想:推理引擎层(TileRT编译期AOT静态编排)传统主流框架以算子(operator/kernel)作为基本调度单元 在单token、小batch场景下会放大调度、访存与同步开销 TileRT彻底抛弃了Runtime层的动态调度 在编译期(AOT)将整个计算图静态编排为一个常驻GPU的persistent Engine Kernel

微新创想:在单卡内 计算、异步IO与通信被拆解为Tile级微任务 整个推理只Launch一次Kernel 中间结果通过寄存器、Shared Memory和L2Cache直传 不再写回全局内存

微新创想:调度系统层通过动态批处理、请求合并和KV缓存调度优化 显著降低了高并发场景下的尾延迟

微新创想:基础设施层在多卡尺度上 TileRT将SM内部的Warp Specialization思路扩展到整张8卡NVL拓扑 不同GPU rank依据计算密度与数据依赖被特化为不同worker 配合网络链路与负载均衡协同优化 确保高性能的常驻稳定性

微新创想:开放计划GLM-5.1高速版适用于对响应延迟要求极高的AI编程、实时交互、商业决策以及实时语音等场景 目前该服务已正式上线智谱MaaS平台并面向部分企业客户开放

微新创想:智谱官方表示 未来将持续推进推理引擎的工程优化 进一步扩大高速模型的服务能力

最新快讯

2026年05月22日

10:32
微新创想:5月22日,BAI资本宣布其新一期目标规模8亿美元的美元基金完成首关,募资达6亿美元。该基金将聚焦三类企业:中国冠军企业出海形成的新增长平台、亚洲本土成长的全球化企业、具备全球创新能力并依托中国市场规模化发展的国际化企业。投资领域涵盖科技与AI、金融服务、消费与娱乐、企业服务等。此举旨在强化对跨境增长与技术创新的支持。
10:32
微新创想:2026年5月,北京硬科技企业中科沌序宣布完成数千万元种子轮融资。本轮融资由首程控股领投,钧犀资本、顺禧基金跟投。公司聚焦Collective AGI、群体智能与自主无人系统,致力于构建低空安全全链条技术新范式。 融资将用于核心技术迭代、产品矩阵完善、团队扩充及商业化拓展,加速AI群体智能技术规模化落地。中科沌序通过此次融资,进一步夯实其在群体智能...
10:32
微新创想:5月21日20时,李佳琦直播间开启618大促预售。首小时GMV实现双位数同比增长,薇诺娜、丝塔芙、维密等爆款上架即售罄。本次预售以“超级美妆节”为首发主题,覆盖美妆、母婴、时尚、食品、家电及宠物等多元品类,国货占比近50%。截至发稿,加购超20万件的热销单品中,国货占半数。增长源于精准选品、国货力推及多品类协同策略。
10:31
微新创想:2026年5月22日,智谱公司宣布面向部分企业客户上线GLM-5.1高速版API(GLM-5.1-highspeed) 该模型实测输出速度达400 tokens/s,创全球大模型API速度新高 其突破性在于首次在国产旗舰大模型中兼顾高性能与低延迟,支持AI编程、实时交互等高响应需求场景 该API由智谱GLM团队与TileRT团队联合研发,通过推理引...
10:31
微新创想:2026年5月,马修·鲍尔(Matthew Ball)正式出任微软Xbox首席战略官。这位以定义“元宇宙”闻名的产业趋势专家,将主导Xbox业务转型。他拥有丰富的行业洞察力与前瞻性的战略眼光,致力于推动Xbox在新时代的竞争优势。 鲍尔的核心目标是扭转近年Xbox增长乏力的局面。他希望通过一系列战略举措,重振经典IP,提升品牌影响力,同时稳固主机业...
10:31
微新创想:2026年5月22日,巴德股份正式在全国中小企业股份转让系统(新三板)挂牌上市。这一重要时刻不仅标志着公司发展历程中的新里程碑,也意味着其在资本市场上的正式亮相。 公司总部位于中国,专注于聚氨酯新材料研发与生产。凭借多年的技术积累与创新实践,巴德股份在行业内树立了良好的口碑,成为众多高端化工产品的领先供应商。 巴德股份的主要产品包括双金属催化剂、特...
10:31
微新创想:5月22日A股盘中,光刻胶概念震荡走强。华软科技、格林达双双涨停,聚石化学、怡达股份、容大感光、久日新材跟涨。此次拉升发生于沪深两市交易时段,地点为中国大陆证券市场,涉及多家半导体材料企业。 光刻胶作为半导体制造中的关键材料,其市场需求与行业发展密切相关。随着国内存储厂与晶圆厂加速扩产,对光刻胶的需求持续上升。这一趋势不仅带动了产业链上下游企业的增...
10:31
微新创想:2026年5月22日,电容器用聚丙烯薄膜制造商嘉德利在上海证券交易所主板正式上市。公司证券代码为603435,发行价15.76元/股,发行市盈率29.72倍。 嘉德利主营业务涵盖电子专用材料开发与制造、电容器薄膜、真空镀膜及电子专用设备制造等领域。公司自成立以来一直专注于高性能电容器薄膜的研发与生产,致力于为客户提供高质量的电子基础材料解决方案。 ...
10:31
微新创想:2026年5月,埃隆·马斯克将SpaceX、xAI与X合并为统一集团。这一整合标志着马斯克旗下多个科技企业迈入新的发展阶段。通过以SpaceX提供的低息过桥贷款置换X和xAI的高息垃圾债,集团成功优化了债务结构。SpaceX的贷款利率为4.58%,而X和xAI的高息债务利率高达12.5%。这一策略不仅降低了财务负担,还提升了资金使用效率。 截至20...
10:31
微新创想:5 月 17 日 甘肃省广播电视总台与甘肃广电传媒集团在兰州联合举行飞天大模型智能体发布暨新媒体发展推进会 此次发布不仅是甘肃广电智能化转型的里程碑 也标志着甘肃省广电媒体正式成为全省首家通过网信办算法备案的单位 本次推出的四大“AI智能体”各司其职 覆盖了从内部生产到外部民生服务的全生态场景 视听甘肃APP智能体 整合了政务宣传 文旅推介与民生服...
10:31
微新创想:在第79届戛纳国际电影节上中国AI短剧迎来了高光时刻 来自杭州的两部全AI制作短剧《摸金之天机入梦》与《饿塔》从全球120个国家、1000余件作品中脱颖而出成功入选戛纳竖屏剧展 这不仅是中国全AI制作短剧首次登上该电影节的官方展映单元更标志着中国AI影视作品已具备国际主流市场的竞争实力 《摸金之天机入梦》由知名作家天下霸唱提供世界观架构延续了其标志...
10:31
微新创想:在 Google I/O2026大会释放大量 Gemini 生态进展后 谷歌于5月21日再度发力智能家居赛道 正式推出全新解决方案“内置 Gemini”(Gemini built-in)该方案旨在将尖端 AI 能力全面引入第三方硬件设备 首期将重点聚焦智能摄像头与智能音箱品类 标志着谷歌正加速复制其当年 Google Assistant 的生态扩张...