
微新创想:微软 AI 首席执行官穆斯塔法·苏莱曼近日宣布推出第二代图像生成模型 MAI-Image-2。该模型在权威评测榜单 LMArena 中表现强劲,直接跃升至全球第三位。在被誉为 AI 生图界“最高竞技场”的 LMArena 排行榜中,MAI-Image-2 的表现令人瞩目:目前排名仅次于谷歌的 Gemini-3.1-flash-image-preview 和 OpenAI 的 GPT-image-1.5-high-fidelity。

相比 2025 年 10 月发布的初代模型(初始排名第九),第二代模型在综合质量上实现了本质突破。技术亮点方面,MAI-Image-2 攻克了“文字乱码”这一行业痛点。它不仅在视觉效果上大幅提升,还显著增强了处理包含文字的信息图表、演示幻灯片及复杂逻辑图表的能力,确保文字清晰且无乱码。
极致写实是 MAI-Image-2 的另一大优势。该模型能够精准还原自然光影、真实肤色,并构建符合物理规律的逼真环境。无论是人物肖像还是自然风景,都能呈现出高质量的视觉效果,满足专业用户对细节的高要求。

电影级构图能力也是 MAI-Image-2 的重要特点。它支持生成具有超现实概念、华丽构图及宏大世界观的超清图像,为创意设计、影视制作等领域提供了强大的工具。用户可以借助这一功能,创造出更具艺术性和表现力的视觉内容。
微软正加速将这一顶尖能力推向用户。即刻体验方面,用户目前已可登录 MAI Playground 平台进行免费试用。产品整合方面,MAI-Image-2 正在逐步接入 Copilot 和必应图像创建者(Bing Image Creator),未来海量普通用户将能在日常办公和创作中直接调用。

此次发布标志着微软在多模态生成领域已稳居第一梯队。通过解决文字渲染这一核心痛点,进一步拓宽了 AI 生图在专业办公领域的应用场景。无论是设计、教育还是商业用途,MAI-Image-2 都将为用户提供更高效、更精准的图像生成体验。
