打破算力垄断：智谱联合华为发布首个全流程国产化多模态大模型 GLM-Image

2026-01-14 10:46:57 AI动态 2 次阅读

智谱正式宣布联合华为开源新一代图像生成模型GLM-Image。该模型最大的突破在于，它是首个在国产芯片算力底座上完成从数据预处理到大规模训练全流程的 SOTA（州级水平）多模态模型。

GLM-Image采用了创新的“自回归 + 扩散解码器”混合架构，成功实现了图像生成与语言模型的深度融合。这一架构设计让模型在处理“知识密集型”生成任务时表现优异，能够精准理解全局指令并刻画局部细节，有效解决了海报排版、PPT制作及复杂科普图生成等长期困扰 AI 绘画的难题。

GLM-Image 支持在单个模型中同时进行文本到图像和图像到图像的生成。

在技术指标上，GLM-Image展现了极强的中文理解与渲染能力。在多项复杂视觉文本生成榜单中，它均位列开源模型第一，尤其擅长处理极具挑战性的汉字生成任务。此外，该模型原生支持从1024到2048尺寸的任意比例图像生成，无需额外训练即可自适应多种分辨率。

目前，GLM-Image已在GitHub和Hugging Face等平台全面开源。为了降低使用门槛，其 API 调用价格低至每张图0.1元，智谱方面表示，未来还将推出经过速度优化后的新版本，进一步提升商用性价比。

划重点:

2026年01月14日

11:49