Meta 公司于 6 月 19 日正式发布了其最新研发的生成式人工智能技术——Voicebox,这一创新突破为音频合成领域带来了全新可能。与 ChatGPT 和 Google Bard 等依赖自然语言处理和机器学习生成文本的模型不同,Voicebox 的核心功能在于生成任意音频内容。

Voicebox 的独特之处在于其强大的音频样本处理能力。只需用户提供 2 秒钟的音频样本,该技术即可精准匹配音频风格,实现高质量的文本转语音功能。更令人惊叹的是,Voicebox 能够在音频被外部噪音干扰时,智能重建被中断的语音片段,确保音频的完整性和流畅性。此外,该技术还支持多语言朗读,用户只需输入英文文本,即可将其转化为法语、德语、西班牙语、波兰语或葡萄牙语等多种语言,极大地拓展了音频应用场景。

Meta 公司表示,Voicebox 在虚拟助手和元宇宙非玩家角色的语音生成方面具有巨大潜力。在元宇宙这一数字世界中,人们可以聚集工作、娱乐和交流,而 Voicebox 生成的自然真实语音将极大提升用户体验。同时,该技术也为视力受损人士带来了福音,让他们能够通过听到朋友们的声音来朗读信息,有效改善沟通体验。

目前,Voicebox 仍处于研发阶段,尚未向公众开放使用。Meta 公司强调,他们充分认识到这项人工智能技术可能带来的潜在风险,特别是语音伪造等安全问题。为此,团队正在积极探索有效方法,以区分真实语音和由 Voicebox 生成的音频,确保技术的安全性和可靠性。随着技术的不断成熟,我们有理由相信 Voicebox 将为音频领域带来更多创新应用,开启音频交互的新纪元。

最新快讯

2025年10月16日

14:25
近日,专注于咖啡、茶饮及简餐运营的埃尔比餐饮宣布完成5000万元A轮融资。作为简餐餐饮品牌运营商,该公司致力于为创业者提供从启动到稳定盈利的全周期运营管理服务。本轮资金将重点投向业务体系升级、技术平台研发及市场拓展三大领域。通过系统性赋能,埃尔比餐饮持续帮助合作方建立独立运营能力,在咖啡、甜品等细分领域构建标准化服务体系。此次融资将推动其在餐饮运营管理领域...
14:25
国防科技大学南湖之光实验室联合科研团队近日在空芯光纤技术领域取得重大突破,首次实现2千瓦高功率激光在2.45公里距离下的全光纤化稳定传输。该成果已发表于《自然·通讯》期刊。传统实芯光纤在8千瓦功率下传输距离仅3米,难以满足工业远程传输需求。研究团队通过创新设计五管双嵌套反谐振空芯光纤,攻克了石英光纤与空芯光纤低损耗熔接等关键技术,实现了近衍射极限光束质量的...
14:25
英国AI云服务企业Nscale于15日宣布,已与微软扩展合作协议,将在美洲和欧洲四地向微软交付总计20万块英伟达GB300 GPU,交易估值达140亿美元。自2026年第三季度起,位于美国得克萨斯州的超大规模数据中心将率先交付10.4万块GPU,该园区初期容量240MW,未来可扩展至1.2GW。同期,葡萄牙Sines数据中心将从2026年一季度起提供约1....
14:25
科技媒体Android Authority报道,谷歌已正式通知Gboard输入法用户,其内置的Bitmoji虚拟形象贴纸功能将于2025年12月15日下线。该调整印证了今年8月代码分析显示的“2026年前逐步淘汰”预测。谷歌通过应用弹窗明确时间表,并附上Bitmoji官网链接引导用户迁移。此次变动仅为集成功能终止,Bitmoji服务仍保持独立运营。用户可通...
14:25
2025年10月15日,联合国世界粮食计划署警告,因援助资金大幅削减,其在6个国家的援助行动受阻,近1400万人或将陷入“紧急”粮食不安全状态。该机构称,今年预计获64亿美元资助,较去年约100亿美元减少约四成,资金状况达历史最严峻水平。资金短缺将直接影响粮食采购与分发,危及多个脆弱国家的民生保障。
14:25
10月16日,中核集团海南昌江多用途模块式小型堆科技示范工程“玲龙一号”一回路冷态功能试验圆满成功。此次试验验证了反应堆系统在高压环境下的密封性和安全性,标志着机组一回路压力边界完整可靠,为后续热试、装料及商运奠定坚实基础。作为全球首个通过国际原子能机构安全审查的陆上商用模块化小堆,“玲龙一号”彰显了我国在新型核能系统设计与工程管理上的综合实力。该项目预计...
14:25
科技媒体NeoWin今日报道,由Atom创始团队打造的高性能代码编辑器Zed已正式推出Windows平台稳定版本。该编辑器采用Rust语言及自研GPUI框架,借鉴游戏引擎设计理念,通过GPU加速实现流畅操作与低内存占用。为优化Windows体验,开发团队重构渲染后端,引入DirectX 11与DirectWrite技术,并深度集成WSL和SSH远程开发功能...
14:25
青海格尔木乌图美仁光伏光热园区今日正式启动全球单机规模最大的塔式光热发电项目建设。该项目总投资54.35亿元,采用自主研发的塔式熔盐储能技术,配备三座吸热塔及330万平方米镜场,成为国内反射面积最大的光热设施。项目计划于2027年9月实现全容量并网,预计年发电量达9.6亿千瓦时,每年可节约标煤26.34万吨,减排二氧化碳72万吨。目前青海清洁能源装机占比已...
14:25
2025湾芯展于10月15日在深圳开幕,吸引全球20多个国家和地区的半导体产业链企业参展。展会面积和参展商数量同比增长超50%,涵盖集成电路领域全球TOP30企业。深圳市重大产业投资集团总经理邱文表示,本届展会集中展示半导体前沿技术与创新成果,推动产业链上下游深度合作。展会为行业提供交流平台,助力湾区打造国际半导体产业高地。
14:25
10月16日,应急管理部在季度例行新闻发布会上表示,将大力推动“久安”大模型的应用。科技和信息化司司长魏平岩指出,人工智能是未来应急管理信息化的主战场,旨在加速构建应急管理新质战斗力,推动应急管理模式变革。此举将促进应急管理战斗力生成方式转型升级,加快应急管理现代化进程。
14:25
微软最新推出的PowerToys 0.95版本带来全新Light Switch工具,支持Windows 11系统在浅色与深色模式间自动切换。用户可自主选择切换系统模式、应用模式或两者同时切换,并支持自定义切换时间段或基于地理位置采用日出日落时间。此次更新同时优化了多项功能:快捷键管理新增冲突忽略选项,查找鼠标工具支持透明度调节,文件速览功能简化为单按空格键...
14:25
谷歌研究院联合耶鲁大学发布基于Gemma的Cell2Sentence-Scale 27B(C2S-Scale)模型,旨在通过单细胞分析推动癌症治疗新路径的发现。该模型聚焦“冷”肿瘤难以被免疫系统识别的问题,探索将“冷”肿瘤转化为可被攻击的“热”肿瘤策略。研究人员利用C2S-Scale模拟4000多种药物反应,发现CK2抑制剂silmitasertib在特定...