微新创想(Idea2003.com) 6月25日讯 YouTube 正在积极探索人工智能在内容创作领域的创新应用,推出了一项革命性工具,旨在通过 AI 技术帮助创作者自动将视频翻译成多种语言并生成配音。这一重要进展在 VidCon 大会上被正式宣布,标志着 YouTube 在全球化内容传播方面迈出了新步伐。
此次合作对象是 Aloud 这家领先的 AI 动画配音服务公司,该企业隶属于谷歌旗下创新孵化器 Area 120。自今年早些时候 YouTube 推出多语言音轨支持功能以来,创作者们已经能够为超过 1 万个视频添加外语文本轨道,覆盖 70 多种语言,极大地拓展了国际受众范围。据 TechCrunch 从 YouTube 获得的最新数据,这项功能已成为吸引全球观众的重要工具。
过去,创作者若想为视频添加配音,必须通过第三方配音机构,这一过程不仅耗时费力,成本高昂,还可能面临沟通障碍。Aloud 的出现彻底改变了这一现状,它允许创作者以零额外费用享受高质量的 AI 配音服务。自 2022 年谷歌首次推出 Aloud 以来,这项由人工智能驱动的配音产品已经展现出强大的技术实力。
Aloud 的工作流程十分智能:首先自动转录视频内容,然后进行精准翻译,最后生成自然流畅的配音版本。值得注意的是,创作者可以在配音生成前对转录文本进行细致审查和编辑,确保内容准确无误。YouTube 创作者产品副总裁 Amjad Hanif 表示,目前该工具正在与数百位创作者进行封闭测试,预计很快将向所有创作者开放使用。
目前 Aloud 支持的语种包括英语、西班牙语和葡萄牙语,但 YouTube 已经规划了更广阔的语言覆盖计划。未来将陆续推出印地语、印尼巴哈萨等更多语言选项,满足不同地区观众的需求。Hanif 特别强调,YouTube 正在致力于提升翻译音轨的自然度,通过技术手段让配音听起来更像是创作者本人的声音,并实现更丰富的情感表达和更精准的口型同步。
YouTube 向 TechCrunch 承诺,随着生成式人工智能技术的不断进步,Aloud 将在未来实现更多突破性功能,包括声音保留技术、更细腻的情感传递能力以及创新的口型重建系统。这些升级将进一步提升 AI 配音的质量和用户体验,为全球创作者提供更强大的内容传播工具。