
微新创想:近日,谷歌为其 AI 助手 Gemini 推出了一项革命性的交互式图像生成功能。这项新功能基于底层的 Nano Banana 技术,使 Gemini 的可视化能力实现了从“静态图像”向“动态交互模拟”的跨越。用户在提出“向我展示”或“帮助我可视化”特定复杂主题时,系统将自动触发“向我展示可视化图表”按钮,生成可操作的数字模拟程序。
在实际测试中,该功能展现了极强的信息承载力。例如,在演示“月球绕地运行”时,用户可以通过滑块实时调节轨道速度并变换观测视角;而在“汽车引擎工作原理”的可视化中,用户不仅能更改动画播放逻辑,还能手动拆解、调整视图以观察每一个机械步骤。这种交互方式相比传统单张图片,能够更直观地解构复杂逻辑与物理过程。

尽管 Anthropic 在今年3月曾为 Claude 发布过类似功能,但 Gemini 的新尝试在动态交互深度上各具特色。目前 Gemini 尚不支持像 Claude 那样保存此类交互生成内容。对于这一功能是否会持续迭代,谷歌官方目前尚未给出明确回应。
目前,这项全新的交互式可视化功能正面向全球范围内的 Gemini 专业版(Pro)用户陆续推出。需要注意的是,现阶段教育版(Education)和工作区(Workspace)账户暂不在支持之列。随着这一技术的普及,AI 生成内容正从单纯的视觉呈现向具备功能性的交互工具演进。
这一趋势在在线教育、工程模拟及科普领域具有重要应用价值。通过交互式可视化,学习者可以更深入地理解抽象概念,工程师能够更高效地展示设计原理,而科普工作者则能以更生动的方式传递科学知识。未来,随着技术的不断完善,交互式 AI 图像生成有望成为各类知识传播的重要手段。
