
阿里通义重磅推出全新生图模型 Z-Image,一经发布便引发广泛关注,首日下载量突破50万次,强势登顶Hugging Face趋势榜。这款创新模型以仅6亿参数的精巧规模,实现了令人惊叹的照片级真实感,能够精准捕捉皮肤细腻质感、发丝纤毫之末,以及自然光影与材质纹理的微妙变化,展现出卓越的美学表现力与构图氛围。
Z-Image特别推出优化版本Z-Image-Turbo,在保持高质量图像生成的同时,将推理步骤缩减至8步,极大提升了创作效率,特别适合日常创作、海报设计及快速原型生成。即便在复杂的文本排版场景中,Z-Image-Turbo依然能够精准渲染中英文混合文本,确保文字清晰可辨,同时完美融合人脸真实感与整体画面美感。
该模型拥有丰富的现实世界知识储备,能够生成埃菲尔铁塔、故宫等著名地标,并在细节、比例与语境上与真实世界高度吻合。通过先进的提示词增强器,Z-Image不仅具备绘图能力,更能理解复杂任务并展开深度创作。此外,Z-Image-Edit专注于复杂复合编辑指令的执行,例如”让人物微笑+转头+背景换成樱花+添加中文标语”,在大幅修改中依然保持光照、身份和风格的高度一致性,有效避免错位与失真问题。

在数据层面,Z-Image构建了高效的数据生态体系,致力于用”对的数据”提升训练效率。模型架构方面,Z-Image创新性地采用了单流扩散Transformer(S³-DiT)技术,显著提高了参数利用率。训练过程中,通过三阶段渐进式策略系统性地注入世界知识,并通过Z-Image-Turbo实现实时高质量生成。
GitHub:https://github.com/Tongyi-MAI/Z-Image
Hugging Face:https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
划重点:
🌟 Z-Image模型首日下载量达50万,迅速登顶Hugging Face趋势榜
🎨 Z-Image以6亿参数实现高质量照片级真实感,兼顾文本渲染
🚀 Z-Image-Turbo和Z-Image-Edit提供高效的图像生成与编辑能力
