智谱GLM-5V-Turbo模型发布视觉编程新突破图片生成代码引领未来

2026-04-02 14:07:55 互联网 5 次阅读

微新创想4月2日消息智谱正式发布面向视觉编程打造的GLM-5V-Turbo多模态Coding基座模型该模型从预训练阶段深度融合视觉与文本能力打破了纯文本输入的编程局限能看懂设计稿截图网页界面并生成可运行代码真正实现了看得懂画面写得出代码

GLM-5V-Turbo拥有三大核心特性其一为原生多模态Coding基座可原生理解图片视频设计稿等多模态输入支持画框截图等多模态工具调用上下文窗口拓展至200k 让Agent的感知-行动链路延伸至视觉交互其二是兼顾视觉与编程能力在多模态Coding GUI Agent等核心基准上表现领先且通过多任务协同RL技术保证纯文本场景下的编程推理能力不退化其三是深度适配Claude Code与龙虾场景可实现看懂环境规划动作执行任务”的完整闭环还配备全套官方Skills 开箱即可使用

实测数据显示 GLM-5V-Turbo在设计稿还原视觉代码生成等基准上均取得领先在AndroidWorld WebVoyager等GUI环境操控测试中表现突出纯文本Coding能力也保持稳定在龙虾Agent相关测试中模型接入后让龙虾拥有真正的视觉能力在PinchBench等评测中斩获优异成绩复杂任务执行能力得到验证

目前GLM-5V-Turbo已落地图像即代码龙虾视觉赋能等典型场景能实现前端复刻 GUI自主探索复刻还能让龙虾完成K线图解读图文报告生成等任务用户可通过AutoClaw Z.ai等产品体验也能通过官方API接入多款官方Skills也已上线ClawHub

2026年04月02日

16:16

智谱GLM-5V-Turbo模型发布视觉编程新突破图片生成代码引领未来

最新快讯

2026年04月02日

肌酸软糖品牌Create完成2000万美元B轮融资推动科学教育与市场拓展

中国邮政携手中国国新开启战略合作新篇章共促金融物流健康教育协同发展

德国人对AI深度伪造技术风险高度担忧调查结果曝光

2025年大中华区甲级写字楼存量近9921万平米趋势分析

索尼Alpha 7R VI或首发10K视频搭载6700万像素部分堆栈CMOS

OPPO Enco Clip2耳夹式耳机4月21日发布丹拿联调开放聆听新体验

AI如何改变未来工作与生活：缩短工时延长寿命的机遇与挑战

阿里云联合浦发银行打造智能识别新方案提升金融服务效率

华润万象生活携手商越科技上线采购门户系统提升管理效率

HR Path完成对Covalence战略收购强化北美HR技术服务能力

洛阳融阙希尔顿格芮精选酒店2026年4月2日盛大开业河南首家生活方式品牌酒店入驻神都十三坊

商务部回应Meta收购Manus：支持合规跨国经营严守中国法律法规

智谱GLM-5V-Turbo模型发布 视觉编程新突破 图片生成代码引领未来

最新快讯

2026年04月02日

智谱GLM-5V-Turbo模型发布视觉编程新突破图片生成代码引领未来