Meta 公司于 6 月 19 日正式发布了其最新研发的生成式人工智能技术——Voicebox,这一创新突破为音频合成领域带来了全新可能。与 ChatGPT 和 Google Bard 等依赖自然语言处理和机器学习生成文本的模型不同,Voicebox 的核心功能在于生成任意音频内容。

Voicebox 的独特之处在于其强大的音频样本处理能力。只需用户提供 2 秒钟的音频样本,该技术即可精准匹配音频风格,实现高质量的文本转语音功能。更令人惊叹的是,Voicebox 能够在音频被外部噪音干扰时,智能重建被中断的语音片段,确保音频的完整性和流畅性。此外,该技术还支持多语言朗读,用户只需输入英文文本,即可将其转化为法语、德语、西班牙语、波兰语或葡萄牙语等多种语言,极大地拓展了音频应用场景。

Meta 公司表示,Voicebox 在虚拟助手和元宇宙非玩家角色的语音生成方面具有巨大潜力。在元宇宙这一数字世界中,人们可以聚集工作、娱乐和交流,而 Voicebox 生成的自然真实语音将极大提升用户体验。同时,该技术也为视力受损人士带来了福音,让他们能够通过听到朋友们的声音来朗读信息,有效改善沟通体验。

目前,Voicebox 仍处于研发阶段,尚未向公众开放使用。Meta 公司强调,他们充分认识到这项人工智能技术可能带来的潜在风险,特别是语音伪造等安全问题。为此,团队正在积极探索有效方法,以区分真实语音和由 Voicebox 生成的音频,确保技术的安全性和可靠性。随着技术的不断成熟,我们有理由相信 Voicebox 将为音频领域带来更多创新应用,开启音频交互的新纪元。

最新快讯

2026年03月03日

20:00
微新创想:2026年3月2日,芬兰初创公司Donut Lab与联合国下属的科研机构VTT技术研究中心合作,完成了对一款固态电池在高温环境下的性能测试。此次测试覆盖了20℃、80℃和100℃三个温度区间,旨在评估固态电池在极端条件下的表现。 测试结果显示,这款3.6V/26Ah的固态电池在100℃的高温环境下,其放电容量达到了27.6Ah,相比室温下的表现提升...
19:26
微新创想:2026年3月3日 中国电影股份有限公司发布公告称 拟使用不超过54亿元暂时闲置的自有资金进行现金管理 此举旨在提高资金使用效率 增加公司收益 资金来源为公司日常经营中暂时闲置的自有资金 不涉及募集资金 投资范围限于安全性高 流动性好的低风险金融产品 该事项尚需公司董事会审议通过 不构成关联交易或重大资产重组
18:54
微新创想:据知情人士消息,埃隆·马斯克旗下X平台与xAI公司拟全额清偿合计约175亿美元债务。此举由摩根士丹利协调,已于近日通知现有债权人。xAI所发30亿美元高收益债券将按面值117%溢价赎回。资金来源未披露。 此次偿债计划涉及的金额巨大,显示出马斯克旗下企业集团在财务上的重大调整。X平台与xAI公司作为马斯克的重要资产,其债务清偿不仅关系到两家公司的运营...
18:54
微新创想:2026年3月3日,国盾量子副总工程师唐世彪荣获2025年“大国工匠年度人物”称号。这一荣誉不仅是对他个人专业能力的认可,也体现了他在量子通信领域的重要贡献。唐世彪所带领的团队研发的量子手机在央视活动现场进行了展示,这款手机搭载了先进的量子密话功能,基于单光子通信技术,具有不可复制、不可分割的特性,能够实时发现任何窃听行为,为信息安全提供了前所未有...
18:53
微新创想:2026年3月3日,晶泰科技孵化企业ReviR宣布其自主研发的小分子药物RTX-117完成首例受试者给药。这一重要进展标志着该药物正式迈入临床研究阶段。 RTX-117是由晶泰科技与ReviR联合发现的创新药物。作为我国首个基于人工智能技术靶向RNA的小分子候选药物,它代表了药物研发领域的一项重大突破。 此次临床试验在境内合规的临床中心启动,主要目...
18:53
微新创想:2026年3月2日,社交媒体X平台正式推出内置“披露付费推广”标签功能。这一功能位于发帖界面底部旗标中,创作者可一键开启,明确标识商务合作或利益相关帖文。该功能的推出,标志着X平台在内容透明化方面迈出了重要一步。 微新创想:此举旨在提升内容可信度,帮助用户更清晰地区分真实分享与广告内容。对于经常浏览社交媒体的用户而言,这一变化将显著改善信息获取的体...
18:53
微新创想:2026年3月3日,谷歌家居负责人阿尼什·卡图卡兰宣布平台多项更新。此次升级面向全球Google Home用户,重点修复长期存在的交互异常问题,并为集成摄像头设备新增Live Search实时搜索功能。 依托新版Gemini模型,系统可即时理解摄像头画面内容,支持自然语言查询,如“车道上有车吗?”。这一功能的引入,极大地提升了用户在智能家居环境中的...
18:53
微新创想:2026年3月3日,美国医疗费用管理平台Ease Health宣布完成4100万美元A轮融资,由Andreessen Horowitz(a16z)领投。此次融资标志着公司在医疗科技领域的重要进展,进一步巩固了其在行为健康服务管理方面的领先地位。 该公司专注于为行为健康服务提供者打造AI驱动的一体化平台,集成客户关系管理、电子健康档案与收费管理功能。...
18:53
微新创想:2026年3月2日,Efor公司正式完成对ND公司的收购。ND是一家总部位于中国、专注于制药行业调试、确认与验证(C&Q)及质量合规服务的解决方案提供商,以患者为中心理念著称。 此次收购旨在强化Efor在生命科学领域的一站式合规服务能力。通过整合ND的专业资源,Efor能够进一步拓展其在制药行业的服务范围,为客户提供更加全面和高效的解决方案...
18:53
微新创想:在本次MWC大会上 小米正式展示了旗下的超级跑车Vision Gran Turismo 这款充满未来感的赛车一经亮相 便迅速吸引了全球汽车爱好者与科技博主的关注 根据官方介绍 这款概念车在设计之初就追求极致的空气动力学性能 它不仅拥有极低的风阻系数 还具备强大的下压力表现 设计师试图通过创新的车身结构 彻底突破传统超跑的效率边界 在设计细节上 ...
18:53
微新创想:中国 AI 硬件出海再传捷报 2026年3月3日,乐奇 Rokid 宣布对其海外版 AI 眼镜 Rokid Glasses 进行重磅软件升级,正式成为全球首款原生支持谷歌 Gemini 的 AI 眼镜。此次升级不仅提升了产品的功能性,更标志着中国 AI 硬件在全球市场上的重要突破。 此次升级后,Rokid Glasses 彻底打破了单一模型的束缚,...
18:19
微新创想:2026年3月3日,Aqara正式推出集悦妙控屏S1 Plus(Siri版) 这款产品是全球首款支持苹果Siri语音控制的智能家居中控屏,标志着Aqara在智能家庭领域迈出了重要一步 设备配备了一块6.9英寸的高清屏幕,为用户带来更加直观的交互体验。同时,内置的双扬声器和四麦克风阵列,确保了语音识别的精准性和稳定性 用户可以通过简单的“嘿,Siri...