智谱正式宣布联合华为开源新一代图像生成模型

GLM-Image 支持在单个模型中同时进行文本到图像和图像到图像的生成。
- 文本转图像:根据文本描述生成高细节图像,在信息密集的场景中表现尤为出色。
- 图像到图像:支持多种任务,包括图像编辑、风格迁移、多主体一致性以及人物和物体的身份保留生成。
在技术指标上,
目前,


-
GitHub:https://github.com/zai-org/GLM-Image
-
Hugging Face:https://huggingface.co/zai-org/GLM-Image
划重点:
-
🇨🇳 国产全栈自研:基于华为昇腾 Atlas800T A2设备与昇思 MindSpore 框架完成全流程训练,验证了国产算力训练顶尖模型的可行性。
-
🎨 文图融合突破:采用混合架构,在 LongText-Bench 等长文本渲染榜单中获得开源第一,大幅提升了汉字与复杂图文的生成准确率。
-
💰 高性价比开源:模型支持多种分辨率自适应生成,并以极低的 API 价格向创作者开放,旨在推动国产认知型生成技术的普及。
