智谱AI开源30B新标杆GLM-4.7-Flash性能力压阿里OpenAI

2026-01-20 09:02:14 AI动态 3 次阅读

智谱AI今日凌晨重磅官宣，正式向全球开源其最新研发的”混合思考”模型——GLM-4.7-Flash，这一30B规格的顶尖模型在性能与轻量化部署之间实现了完美平衡，凭借卓越的推理编码能力强势登顶同类规格模型性能榜首。

性能领跑：30B级别的”全能王者”GLM-4.7-Flash
该模型采用创新的30B-A3B MoE（混合专家）架构，总参数量高达300亿，但在实际任务处理中仅需激活约30亿精锐参数。这种精妙设计在资源占用与处理能力之间构建了理想平衡，使其成为30B规格中的性能标杆。多项权威基准测试结果印证了其卓越表现：

在软件工程领域，GLM-4.7-Flash以59.2分的优异成绩超越同行，展现出顶尖的代码修复能力；数学与推理能力同样突出，AIME25测试斩获91.6分，GPQA（专家级问答）达到75.2分；工具协作方面，τ²-Bench测试成绩79.5分，BrowseComp测试42.8分，在智能体（Agent）场景下表现尤为亮眼。

开发者友好：灵活的本地化部署方案
GLM-4.7-Flash主打轻量化与实用主义，特别适合本地或私有云环境部署。为确保性能稳定释放，该模型已获得主流推理框架全面支持：

– vLLM与SGLang：均在main分支提供稳定支持，开发者可通过tensor-parallel-size和speculative-config等参数优化并发与解码速度；SGLang更支持EAGLE算法进一步提升推理效率
– Hugging Face：支持直接通过transformers库调用，极大降低了快速实验与集成的技术门槛

市场反馈：不牺牲轻便的性能跃迁
行业社区对该版本发布反响热烈。众多开发者表示，GLM-4.7-Flash在不增加硬件负担的前提下，显著提升了实际任务中的”体感速度”。一位资深开发者评价道：”它在编码和工具调用上的表现让本地AI助手真正好用，这种性能与效率的完美平衡正是我们长期追求的。”

开源地址：https://huggingface.co/zai-org/GLM-4.7-Flash

2026年01月20日

11:35

智谱AI开源30B新标杆GLM-4.7-Flash性能力压阿里OpenAI

最新快讯

2026年01月20日

灵光App全面登陆12大市场鸿蒙用户享多模态AI新体验

真我Neo8支持PC掌机模式适配50款游戏无网也能玩3A大作

南方游客哈尔滨舔冰块舌尖流血专家支招正确解冻方法

天目智能完成Pre-A+轮融资苏控创投领投专注储能热管理

九界科技获曲阜鑫晟Pre-A轮投资加速AI物联网布局

支付宝2026马年集福1月27日开启抢福卡赢大奖

小米SU7 Max创纪录4264公里续航领跑国产电动车

Akasa发布六款H6L系列风冷散热器 150W热管旗舰静音散热新选择

Nothing A009/A009P新机曝光或推Pro版旗舰

OPPO ColorOS 16一月体验升级推送

南京网约车新规：取消户籍限制提升司机权益保障

TikTok推独立短剧平台PineDrama 60秒连续剧免费看