Aug X于8月11日宣布推出创新性人工智能视频创作平台Augie,该平台融合了先进的语音克隆技术,让营销人员和社会媒体团队无需进入录音棚即可轻松为广告文案录制旁白。通过与ElevenLabs深度合作,Augie用户能够录制个人或他人声音,并将其克隆应用于各类短视频创作中。
Augie平台专为内容创作者设计,通过可视化界面实现视频快速制作,用户可便捷添加旁白、图片素材、文字说明及背景音乐,无需掌握复杂的音视频编辑技能。创始人Jeremy Toeman表示,推出语音克隆功能的初衷源于对用户录制体验的洞察:”许多人因不适应麦克风录制而犹豫,但语音克隆功能上线后,我们收到大量感谢反馈。”在The Verge的现场演示中,Toeman展示了平台的核心操作流程:用户只需输入或上传脚本,选择预先录制的人声片段(需先录制15秒语音样本)或从授权声音库中挑选,系统会自动根据视频氛围调整语调(包括严肃、活泼、悬疑等风格)。此外,平台整合了Getty授权的图片库和AI生成图像功能,为视频创作提供丰富素材选择。
Toeman描绘了该平台对营销行业的变革性影响:”企业不再受限于发言人档期,随时随地都能制作高质量短视频。”自5月开启公测以来,所有用户均可免费体验语音克隆功能。但Toeman透露,未来可能对非付费用户实施限制,包括视频时长、画质及克隆声音数量,主要由于与ElevenLabs合作的云端服务器成本高昂。
尽管语音克隆技术并非全新概念(三星已将AI声音应用于智能电话),但Augie将其整合为完整创作解决方案,引发行业广泛关注。近期深度伪造技术被用于伪造德雷克歌曲引发版权争议,更凸显了技术伦理的重要性。对此Toeman强调:”我们已建立多重安全机制,严格管控声音克隆权限。”平台规定个人账户录制的声音仅限本账户使用,同一组织成员需重新录制才能克隆他人声音。特别值得注意的是,平台仅接受实时麦克风录制,不支持录音文件上传,确保声音来源的真实性。此外,Augie与ElevenLabs共同研发了AI声音识别技术,能够有效鉴别合成音视频,为内容原创性提供保障。