
谷歌近期对 Gemini 应用进行了重大升级,推出了一项突破性的 AI 视频生成控制功能,为用户带来前所未有的创作体验。现在用户只需在单个视频提示中上传多张参考图像,系统便能结合这些图像与文本信息,智能生成匹配的视频和音频内容。这一创新功能显著增强了用户对最终成品外观和声音的掌控力,让个性化创作变得触手可及。
此前谷歌已在其扩展视频 AI 平台 Flow 中成功测试了这一技术。Flow 平台不仅支持对现有视频片段进行智能扩展,还能将多个场景无缝拼接,更关键的是,它提供了比 Gemini 应用高出不少的视频生成配额。这一举措为专业创作者提供了更强大的技术支持。
值得关注的是,谷歌自10月中旬发布的 Veo3.1版本相比前代产品在多个维度上实现了质的飞跃。新版本在纹理真实感、输入保真度以及音频质量方面均有显著提升,为用户呈现更加逼真的视觉和听觉效果。通过这次全面升级,用户能够更灵活地运用 AI 工具,打造出更符合自身需求的创意内容。

多参考图像上传功能的推出,意味着创作者可以在视频制作过程中融入更多个性化元素,为观众带来更加丰富多元的视听体验。在当前 AI 技术日新月异的背景下,谷歌的这一创新举措充分彰显了其在视频生成领域的领先地位。随着用户对内容个性化需求的不断提升,AI 工具的灵活性和可定制性将成为核心竞争力,Gemini 的新功能必将吸引更多创作者的目光。
划重点:🌟 用户可通过上传多张参考图像来精准引导 AI 生成视频和音频内容。 🎥 新功能大幅提升用户对视频最终效果的控制精度。 🔊 Veo3.1版本在视频纹理真实感、输入保真度及音频体验上实现全面突破。
