微新创想(Idea2003.com) 6月25日讯 YouTube 正在积极探索人工智能在内容创作领域的创新应用,推出了一项革命性工具,旨在通过 AI 技术帮助创作者自动将视频翻译成多种语言并生成配音。这一重要进展在 VidCon 大会上被正式宣布,标志着 YouTube 在全球化内容传播方面迈出了新步伐。

此次合作对象是 Aloud 这家领先的 AI 动画配音服务公司,该企业隶属于谷歌旗下创新孵化器 Area 120。自今年早些时候 YouTube 推出多语言音轨支持功能以来,创作者们已经能够为超过 1 万个视频添加外语文本轨道,覆盖 70 多种语言,极大地拓展了国际受众范围。据 TechCrunch 从 YouTube 获得的最新数据,这项功能已成为吸引全球观众的重要工具。

过去,创作者若想为视频添加配音,必须通过第三方配音机构,这一过程不仅耗时费力,成本高昂,还可能面临沟通障碍。Aloud 的出现彻底改变了这一现状,它允许创作者以零额外费用享受高质量的 AI 配音服务。自 2022 年谷歌首次推出 Aloud 以来,这项由人工智能驱动的配音产品已经展现出强大的技术实力。

Aloud 的工作流程十分智能:首先自动转录视频内容,然后进行精准翻译,最后生成自然流畅的配音版本。值得注意的是,创作者可以在配音生成前对转录文本进行细致审查和编辑,确保内容准确无误。YouTube 创作者产品副总裁 Amjad Hanif 表示,目前该工具正在与数百位创作者进行封闭测试,预计很快将向所有创作者开放使用。

目前 Aloud 支持的语种包括英语、西班牙语和葡萄牙语,但 YouTube 已经规划了更广阔的语言覆盖计划。未来将陆续推出印地语、印尼巴哈萨等更多语言选项,满足不同地区观众的需求。Hanif 特别强调,YouTube 正在致力于提升翻译音轨的自然度,通过技术手段让配音听起来更像是创作者本人的声音,并实现更丰富的情感表达和更精准的口型同步。

YouTube 向 TechCrunch 承诺,随着生成式人工智能技术的不断进步,Aloud 将在未来实现更多突破性功能,包括声音保留技术、更细腻的情感传递能力以及创新的口型重建系统。这些升级将进一步提升 AI 配音的质量和用户体验,为全球创作者提供更强大的内容传播工具。

最新快讯

2025年12月18日

13:57
在12月18日举办的FORCE原动力大会上,火山引擎交出了一份惊人的成绩单:截至今年12月,豆包大模型日均Tokens使用量已突破50万亿,稳居中国第一、全球第三。会上,火山引擎正式发布了豆包大模型1.8与视频生成模型Seedance1.5pro。其中,豆包1.8版本针对多模态Agent场景进行了深度优化,不仅视觉理解能力大幅提升,支持超长视频分析,更在工具...
13:57
据 AIbase 报道,为了撼动英伟达在 AI 芯片领域的统治地位,Alphabet(谷歌母公司)正在推进一项名为“TorchTPU”的战略计划。该计划旨在显著提升其张量处理单元(TPU)芯片对 PyTorch 框架的兼容性,从而降低开发者从英伟达 GPU 切换至谷歌 TPU 的技术门槛和迁移成本。长期以来,PyTorch 作为全球应用最广泛的开源 AI 开...
13:57
在AI重塑浏览器定义的关键时刻,Mozilla迎来新掌舵人——Anthony Enzor-DeMeo正式出任CEO,接替临时CEO劳拉·钱伯斯(Laura Chambers)。这位前Firefox业务总经理的升任,标志着这家以隐私和开放网络为使命的组织,正试图在AI浪潮中走出一条“不妥协”的第三条路。当前,浏览器市场正经历十年未有之变局。传统三巨头——Chr...
13:27
2025年12月18日,火山引擎原动力大会现场,火山引擎总裁谭待发布了豆包大模型的最新发展里程碑。他透露,这款备受瞩目的AI大模型日均处理量已突破50万亿Tokens,这一惊人数字不仅彰显了其强大的算力支撑,更标志着豆包大模型自发布以来实现了令人瞩目的417倍增长。 这一突破性进展的背后,是豆包大模型在企业级市场的深度渗透与广泛认可。目前,“万亿Toke...
13:27
2025年12月,我国在虚拟数字人领域迎来历史性突破,正式发布首部国家标准——《信息技术客服型虚拟数字人通用技术要求》。这一重要举措由相关部门牵头制定,标志着我国在虚拟数字人技术标准化方面迈出关键一步,旨在全面规范客服型虚拟数字人的技术研发与应用流程。作为行业首个权威标准,该文件系统性地明确了从研发设计、生产制造到服务运营全过程中的技术规范与评估方法,为行业...
13:27
2025年12月18日,科技界迎来重磅消息。小米创始人、董事长兼CEO雷军通过个人微博正式官宣,备受瞩目的小米17 Ultra旗舰手机将于下周揭开神秘面纱。此次发布会将全面聚焦影像技术的革新与突破,彰显小米在高端智能手机市场持续深耕的决心与实力。雷军在预告中并未透露具体的发布时间与详细配置参数,但明确表示这款新机将代表小米手机影像能力的最高水准,有望再次刷新...
13:27
2023年11月,国家统计局发布了最新全国城镇分年龄组失业率数据,揭示了不同年龄段劳动力市场的显著差异。数据显示,不包含在校生的16-24岁劳动力失业率高达16.9%,这一数字凸显了青年群体面临的严峻就业挑战。相比之下,25-29岁群体的失业率为7.2%,虽然仍处于相对较高的水平,但已明显低于青年群体。而30-59岁劳动力的失业率则降至3.8%,显示出更为稳...
13:27
2025年12月18日,国家发展和改革委员会正式发布《着力扩大有效投资》政策文件,明确提出将全面推行“实施一批、前期一批、储备一批、谋划一批”的动态管理机制,为扩大有效投资提供强有力的项目支撑体系。这一创新举措旨在通过系统化项目管理,显著提升投资项目的落地效率与实际效益,确保每一笔投资都能产生最大化的社会价值。发改委在文件中特别强调,将加强“十五五”时期重大...
13:27
2025年1月底,菜鸟网络宣布将携手天猫超市在全国31座城市同步推进闪购仓的新建或扩建工程,旨在全面提升淘宝闪购服务的配送效率。这一战略布局将使消费者能够通过淘宝闪购平台,便捷地选购乳制品、酒水饮料、速食食品、美妆个护等严选日用品,享受更加优质的线上购物体验。 随着闪购仓网络的完善,配送时效将迎来革命性突破。消费者只需在上午时段下单,即可享受当日傍晚送达...
13:27
2025年12月18日,阿里千问APP迎来历史性突破,正式与阿里生态中的高德地图实现深度整合,标志着其具备了感知物理世界并执行现实行动的核心能力。此次系统级对接不仅让千问APP能够无缝调用高德地图的丰富数据资源,还能直接访问扫街榜等特色服务,从而为用户生成包含精准推荐餐厅、优质酒店、实时位置信息以及智能出行方案的可视化决策卡片。这一创新应用场景的落地,意味着...
13:27
2025年12月18日,谷歌在安卓16 QPR3 Beta 1版本中推出了一项突破性更新,彻底解除了外接显示器的投屏限制。这一重要功能在Pixel 9 Pro设备上率先得到测试验证,系统不仅能精准识别外接显示器,还支持将画面无线串流至Chromecast等兼容设备。与此前版本仅能投屏手机界面或单一应用不同,此次更新开创性地允许用户将外接显示器作为投屏源,实现...
13:27
2025年12月18日,派杰投资发布最新研究报告,正式将美光科技(Micron Technology)的股票目标价从200美元上调至275美元,上调幅度高达37.5%。这一显著调整充分体现了市场分析师对美光科技未来业绩的强烈信心,以及对其在存储芯片领域持续增长的乐观预期。报告指出,随着全球半导体市场逐步回暖,尤其是存储芯片需求呈现明显复苏态势,美光科技有望成...