微新创想(Idea2003.com) 6月25日讯 YouTube 正在积极探索人工智能在内容创作领域的创新应用,推出了一项革命性工具,旨在通过 AI 技术帮助创作者自动将视频翻译成多种语言并生成配音。这一重要进展在 VidCon 大会上被正式宣布,标志着 YouTube 在全球化内容传播方面迈出了新步伐。

此次合作对象是 Aloud 这家领先的 AI 动画配音服务公司,该企业隶属于谷歌旗下创新孵化器 Area 120。自今年早些时候 YouTube 推出多语言音轨支持功能以来,创作者们已经能够为超过 1 万个视频添加外语文本轨道,覆盖 70 多种语言,极大地拓展了国际受众范围。据 TechCrunch 从 YouTube 获得的最新数据,这项功能已成为吸引全球观众的重要工具。

过去,创作者若想为视频添加配音,必须通过第三方配音机构,这一过程不仅耗时费力,成本高昂,还可能面临沟通障碍。Aloud 的出现彻底改变了这一现状,它允许创作者以零额外费用享受高质量的 AI 配音服务。自 2022 年谷歌首次推出 Aloud 以来,这项由人工智能驱动的配音产品已经展现出强大的技术实力。

Aloud 的工作流程十分智能:首先自动转录视频内容,然后进行精准翻译,最后生成自然流畅的配音版本。值得注意的是,创作者可以在配音生成前对转录文本进行细致审查和编辑,确保内容准确无误。YouTube 创作者产品副总裁 Amjad Hanif 表示,目前该工具正在与数百位创作者进行封闭测试,预计很快将向所有创作者开放使用。

目前 Aloud 支持的语种包括英语、西班牙语和葡萄牙语,但 YouTube 已经规划了更广阔的语言覆盖计划。未来将陆续推出印地语、印尼巴哈萨等更多语言选项,满足不同地区观众的需求。Hanif 特别强调,YouTube 正在致力于提升翻译音轨的自然度,通过技术手段让配音听起来更像是创作者本人的声音,并实现更丰富的情感表达和更精准的口型同步。

YouTube 向 TechCrunch 承诺,随着生成式人工智能技术的不断进步,Aloud 将在未来实现更多突破性功能,包括声音保留技术、更细腻的情感传递能力以及创新的口型重建系统。这些升级将进一步提升 AI 配音的质量和用户体验,为全球创作者提供更强大的内容传播工具。

最新快讯

2025年12月15日

08:35
近日,网络上掀起了一股关于“一碗木薯糖水为何能让人‘迷昏’”的热议浪潮。许多网友纷纷分享自己食用木薯糖水后出现的头晕、乏力等不适症状,这一现象不仅引发了广泛关注,更让这一传统甜品的安全性受到了前所未有的质疑。 木薯作为一种常见的食材,其本身含有一定量的氰化物,这是一种对人体有害的毒素。如果木薯未经充分处理或食用过量,都可能导致中毒事件的发生。在制作木薯糖水的...
08:27
2025年5月13日起,微软开始在部分iOS应用(如OneDrive)的更新日志末尾添加特殊标注"本更新说明由Copilot生成"。这一创新举措并非源于苹果公司的强制要求,而是微软主动采取的策略,疑似旨在借助高曝光的应用更新场景,有效推广其前沿AI助手Copilot。值得注意的是,这类标注主要出现在内容较为丰富、影响范围较大的重大版本更新中,而对于小型修复性...
08:27
2025年12月,我国自主研发的新型高空长航时无人机彩虹-7成功完成首飞,标志着我国在无人机领域取得重大突破。这款无人机翼展超过27米,采用先进的气动设计、隐身技术和智能控制系统,能够在高空亚音速环境下稳定飞行。彩虹-7具备强大的任务执行能力,可在高对抗环境下执行侦察、情报获取任务,并为远程打击提供精准的目标指示,是我国国防力量现代化的重要装备。 此前,彩虹...
08:27
2025年12月15日凌晨,全球电竞舞台再掀波澜,Team Vitality在《反恐精英2》(CS2)布达佩斯Major决赛中以3:1的比分力克FaZe Clan,成功卫冕这一电竞界的最高荣誉。继今年上半年在BLAST.tv奥斯汀站夺冠后,Vitality再次证明了自己的统治力,将Major冠军奖杯收入囊中,书写新的传奇篇章。 在这场激动人心的决赛中,Vit...
08:27
2025年12月15日,光伏行业迎来重大突破天合光能宣布其研发的大面积钙钛矿/晶体硅叠层电池转换效率高达32.6%,这一成果不仅刷新了同尺寸电池的世界纪录,更标志着下一代高效光伏技术迈入新纪元。该技术突破由天合光能光伏科学与技术全国重点实验室与怀柔实验室联合攻关完成,其严谨性和可靠性已获得德国Fraunhofer ISE CalLab权威认证。更令人瞩目的是...
08:27
2025年12月14日,苹果iOS系统用户群体中,部分用户遭遇了照片应用异常红色滤镜的困扰。这一技术问题具有明显的局限性,仅在放大查看图片时才会显现,而缩略图显示却完全正常。经过初步排查,受影响的照片绝大多数是通过安卓设备拍摄后传输至iPhone的。有技术分析人士推测,该问题可能源于iOS系统在解析ICC颜色配置文件时出现错误,导致图片在放大状态下呈现出不自...
08:27
2025年12月15日,科技巨头Alphabet因SpaceX完成新一轮要约收购而迎来巨额账面收益。此次交易将SpaceX的估值推升至约8000亿美元,较此前评估值实现了惊人的飞跃。作为这家航天科技公司的早期投资者,Alphabet自2015年起便持有其约10%的股权。尽管这项投资并未在Alphabet的财务报告中单独列出,但SpaceX估值的显著提升将通过...
08:27
2025年12月13日,海辰储能于厦门隆重举办第三届生态日活动,向全球首发三项突破性的长时储能创新成果,标志着行业技术迈入新纪元。此次发布的∞Power8、∞Cell 1300Ah 8h以及∞Power Solutions For Al Data Center,分别刷新了全球首个原生8小时长时储能系统、专用电芯及锂钠协同AI数据中心全时储能解决方案的纪录,展...
07:27
2025年12月15日,我国海上风电发展史上迎来里程碑时刻——三峡江苏大丰800兆瓦海上风电项目成功实现全容量并网发电。该项目坐落于盐城大丰区海域,最远距离海岸线达85.5千米,是当前中国已并网运行的离岸最远海上风电工程。整个项目共安装了98台先进的 offshore wind turbines,总装机容量高达800万千瓦,每年预计可输送清洁电能超过26亿度...
07:27
加拿大滑铁卢大学的研究团队近日宣布成功研发出一种名为SubTrack++的创新训练方法,该技术能够显著提升大语言模型在预训练阶段的效率与准确性。这一突破性成果于2025年12月15日正式获得验证,证实其能够大幅缩短AI模型的训练周期,同时有效降低模型开发所需的经济成本与能源消耗。 SubTrack++的核心优势在于其独特的训练数据优化策略,通过智能分配和...
07:27
2025年12月9日,科技界迎来一项创新突破——初创公司Sensia Technology正式发布了其研发的便携式织物音箱。这款产品采用柔性导电纤维精心编织而成,其独特之处在于运用了类似静电音箱的电容器结构。通过精密的电场调制技术,整块织物能够实现震动发声,为用户带来全新的听觉体验。 该织物音箱的最大音量可达68dB,当成对使用时,音量更可提升至71dB,足...
07:27
2025年12月15日,备受瞩目的三峡江苏大丰800兆瓦海上风电项目正式宣告全容量并网成功。这一标志性工程坐落于江苏大丰海域,不仅刷新了我国离岸距离最远的海上风电纪录,更象征着我国在深远海风电领域实现了历史性跨越。随着最后一台风机顺利启动并投入运行,整个项目正式迈入全面发电阶段,预计年发电量可达80亿千瓦时,相当于每年减少碳排放800万吨,为区域能源结构优化...