微新创想:2026年5月22日,智谱公司宣布面向部分企业客户上线GLM-5.1高速版API(GLM-5.1-highspeed)
该模型实测输出速度达400 tokens/s,创全球大模型API速度新高
其突破性在于首次在国产旗舰大模型中兼顾高性能与低延迟,支持AI编程、实时交互等高响应需求场景
该API由智谱GLM团队与TileRT团队联合研发,通过推理引擎重写、动态批处理调度优化及基础设施协同升级实现系统级提速
目前仅限智谱MaaS平台部分企业客户使用
微新创想:2026年5月22日,智谱公司宣布面向部分企业客户上线GLM-5.1高速版API(GLM-5.1-highspeed)
该模型实测输出速度达400 tokens/s,创全球大模型API速度新高
其突破性在于首次在国产旗舰大模型中兼顾高性能与低延迟,支持AI编程、实时交互等高响应需求场景
该API由智谱GLM团队与TileRT团队联合研发,通过推理引擎重写、动态批处理调度优化及基础设施协同升级实现系统级提速
目前仅限智谱MaaS平台部分企业客户使用