Meta 公司于 6 月 19 日正式发布了其最新研发的生成式人工智能技术——Voicebox,这一创新突破为音频合成领域带来了全新可能。与 ChatGPT 和 Google Bard 等依赖自然语言处理和机器学习生成文本的模型不同,Voicebox 的核心功能在于生成任意音频内容。

Voicebox 的独特之处在于其强大的音频样本处理能力。只需用户提供 2 秒钟的音频样本,该技术即可精准匹配音频风格,实现高质量的文本转语音功能。更令人惊叹的是,Voicebox 能够在音频被外部噪音干扰时,智能重建被中断的语音片段,确保音频的完整性和流畅性。此外,该技术还支持多语言朗读,用户只需输入英文文本,即可将其转化为法语、德语、西班牙语、波兰语或葡萄牙语等多种语言,极大地拓展了音频应用场景。

Meta 公司表示,Voicebox 在虚拟助手和元宇宙非玩家角色的语音生成方面具有巨大潜力。在元宇宙这一数字世界中,人们可以聚集工作、娱乐和交流,而 Voicebox 生成的自然真实语音将极大提升用户体验。同时,该技术也为视力受损人士带来了福音,让他们能够通过听到朋友们的声音来朗读信息,有效改善沟通体验。

目前,Voicebox 仍处于研发阶段,尚未向公众开放使用。Meta 公司强调,他们充分认识到这项人工智能技术可能带来的潜在风险,特别是语音伪造等安全问题。为此,团队正在积极探索有效方法,以区分真实语音和由 Voicebox 生成的音频,确保技术的安全性和可靠性。随着技术的不断成熟,我们有理由相信 Voicebox 将为音频领域带来更多创新应用,开启音频交互的新纪元。

最新快讯

2026年02月24日

07:27
2026年2月24日,Uber宣布收购美国停车预约平台SpotHero。交易条款未披露,预计于2026年上半年完成,尚需监管批准。SpotHero总部位于芝加哥,成立于2011年,已在美国和加拿大400多座城市提供超1.3万个停车点位服务。收购后,Uber将在其App内集成SpotHero技术,优化自驾用户在场馆、机场等地的停车体验。此举旨在增强Uber出...
07:27
2026年2月24日,苹果在iOS 26.4 Beta 2(版本号23E5218e)中将沿用近二十年的系统启动器iBoot正式更名为mBoot,版本号由13822跃升至18000开头。该变更已获AppleInsider验证,并同步出现在Apple Silicon Mac的macOS 26.4测试版底层代码中。mBoot作为设备开机时安全引导和内核签名验证的...
07:27
2026年2月24日,苹果面向开发者推送iOS/iPadOS 26.4 Beta 2。本次更新重点测试iPhone与安卓设备间的RCS端到端加密通信(限部分国家和地区),启用后显示锁定图标;界面引入‘液态玻璃’编辑菜单、统一彩虹色Apple Logo,并调整游戏搜索栏位置;新增‘减少高亮效果’辅助选项及点击查看系统Build号功能;测试版管理机制优化,闲置...
07:27
2026年2月13日,特斯拉在加州法院起诉州机动车辆管理局(DMV),要求撤销其关于特斯拉虚假宣传自动驾驶功能的裁定。该裁定源于州行政听证办公室两个月前的认定,称“Autopilot”和“Full Self-Driving”等命名误导消费者,但DMV未吊销牌照,仅要求整改;特斯拉于2月17日前完成表述调整。特斯拉主张相关术语附有明确安全提示,消费者不会误解...
07:27
2026年2月23日(周一),美国纽约,人工智能公司Anthropic发布Claude Code新功能,可自动化COBOL代码现代化改造,致IBM股价单日下跌13.2%,创2020年以来最大单日跌幅。COBOL支撑全美95%的ATM交易,其系统改造长期是IBM高利润咨询业务支柱。Anthropic称AI可将数年工作压缩至数月,冲击IBM Z系列大型机及Wa...
07:27
微新创想:2026年2月24日 据知情人士透露 派拉蒙天舞计划上调对华纳兄弟探索公司的收购报价 此次调整发生于美国洛杉矶 涉及双方正在进行的媒体资产整合谈判 派拉蒙天舞由派拉蒙全球与天舞传媒合资组建 旨在增强流媒体与内容制作竞争力 提价动因系应对市场竞争加剧及WBD核心IP估值重估 交易若达成 将成为近年全球最大传媒并购案之一 目前尚无具体报价金额及时间表披...
04:28
微新创想:2026年2月24日,亚马逊宣布将在美国路易斯安那州投资120亿美元建设其首个数据中心园区。这一重大举措标志着亚马逊在北美地区的基础设施布局迈出了重要一步。 项目由亚马逊与Stack Infrastructure合作开发,不仅包括数据中心设施的建设,还涉及本地水务基础设施的升级。其中,水务基础设施的投资高达4亿美元,显示出亚马逊对可持续发展和环境责...
02:39
微新创想:2026年2月24日,苹果向注册开发者推送了iOS/iPadOS 26.4开发者预览版Beta 2(版本号23E5218e)。此次更新距离上一版Beta或RC版本发布仅相隔7天,属于常规的版本迭代。该版本主要针对iPhone和iPad用户,开发者可以通过登录苹果开发者计划,在“设置→通用→软件更新”中找到并安装。 此次更新处于正式版本发布前的测...
02:39
微新创想:2026年2月24日,苹果向注册开发者推送了macOS 26.4开发者预览版Beta 2(内部版本号25E5218f)。此次更新距离上一版Beta或RC版本仅隔7天,属于常规的迭代节奏。苹果在软件开发过程中,通常会保持较快的更新频率,以便及时修复问题并引入新特性。 升级该版本需要开发者登录苹果官方开发者账号,并通过系统设置中的“软件更新”功能进行下...
02:39
微新创想:2026年2月24日,苹果向Vision Pro开发者用户推送了visionOS 26.4开发者预览版Beta 2(版本号23O5220e)。此次更新距离上一版Beta或RC版本的发布仅相隔7天,显示出苹果在visionOS系统迭代上的快速节奏。由于区域服务器缓存差异,部分用户可能会在收到推送后延迟约半小时才能完成更新。 此次发布的visionOS...
02:07
微新创想:2026年2月24日 据知情人士透露 美国支付巨头PayPal在近期股价持续走低背景下 已收到初步收购意向 事件发生于美国加州圣何塞(PayPal总部所在地) 涉事方为未具名的潜在战略或财务买家 此举或源于PayPal近年增长承压 市场份额受竞争挤压及盈利预期下调等因素 目前公司尚未宣布任何正式谈判或交易计划 亦未就相关传闻作出公开回应 收购意向尚...

2026年02月23日

23:51
微新创想:2026年2月23日,谷歌联合教育组织ISTE与ASCD宣布启动一项全国性AI教育计划。该计划将为美国600万名在职教师免费提供Gemini及NotebookLM使用培训。旨在提升教师AI素养,并指导其在课堂中安全有效地引导7400万名学生应用AI工具。 课程设计注重实用性,包含具体教学案例,帮助教师更好地理解和运用AI技术。预计未来数月内开放报名...