Meta突破性Omnilingual ASR系统 支持超1600种语言语音识别

Meta 旗下前沿人工智能研究团队 FAIR 近期震撼发布了一款革命性自动语音识别系统——Omnilingual ASR,其核心突破在于能够精准转录超过1600种语言的口语表达。这一里程碑式的成果打破了传统语音识别技术仅聚焦于数百种资源丰富语言的局限,填补了全球7000多种语言中绝大多数语言缺乏AI支持的技术鸿沟。据FAIR团队介绍,此次推出的1600种语言中,竟有高达500种语言此前从未被任何AI系统覆盖过,这充分彰显了Meta在通用转录系统领域的雄心壮志,其最终目标是通过这一技术彻底打破全球语言交流的壁垒。

Omnilingual ASR 的性能表现令人瞩目。Meta公布的测试数据显示,在全部1600种语言中,有78%的语言字符错误率低于10%,而在训练音频超过10小时的语言中,这一比例更是提升至95%。即便是那些传统意义上的”低资源”语言,即音频训练时间不足10小时的语言,仍有36%实现了低于10%的字符错误率。这一卓越表现充分证明了该系统在资源有限条件下的强大适应能力。

为了进一步推动语音识别技术的普惠发展,Meta同步发布了Omnilingual ASR语料库这一宝贵资源。该语料库包含350种长期被忽视的欠代表性语言的转录语音数据,所有数据均以知识共享CC-BY许可证开放,旨在赋能开发者和研究人员根据特定地域需求定制或优化语音识别模型。这一举措将极大促进全球语言多样性保护和技术公平性提升。

Omnilingual ASR 最具创新性的功能之一是”自带语言”选项。该系统采用先进的上下文学习方法,用户只需提供少量配对的音频和文本样本,系统便能直接从这些示例中自主学习,无需进行复杂的重训练或消耗大量计算资源。Meta团队测算显示,这一创新方法理论上可将Omnilingual ASR的应用范围扩展至超过5400种语言,远超当前行业技术所能达到的语言覆盖水平。尽管在资源匮乏的语言上识别质量尚未达到全面训练系统的水准,但这一解决方案为历史上从未接触过语音识别技术的语言社区提供了切实可行的技术路径。

Meta突破性Omnilingual ASR系统 支持超1600种语言语音识别插图1

作为开源项目,Omnilingual ASR 采用了业界通行的Apache2.0许可证,完全开放给研究人员和开发者使用、修改和商业化应用。系统提供了从300百万参数的轻量级版本到7十亿参数的顶尖准确度版本,所有模型均基于FAIR团队成熟的PyTorch框架开发。用户还可以通过官网进行实时演示体验。

demo:https://aidemos.atmeta.com/omnilingualasr/language-globe

划重点:🌍 Meta 推出 Omnilingual ASR 系统,支持超过1600种语言的语音识别,旨在填补 AI 在语言识别上的空白。📊 系统准确性依赖于训练数据,大部分支持的语言字符错误率低于10,部分低资源语言亦有显著表现。📦 Omnilingual ASR 为开源项目,提供丰富的数据集,支持开发者针对地方需求进行模型构建。

最新快讯

2025年11月28日

09:34
2025年第四季度以来,震裕科技来自机器人行业的订单明显增长,灵巧手零部件及组件订单增速较快。尽管如此,由于公司主营业务收入体量较大,前三季度达65.93亿元,机器人相关订单占比仍极小。受益于下游需求旺盛,公司近两个月排产环比持续提升。财报显示,2025年前三季度震裕科技归母净利润达4.12亿元,同比增长138.93%。
09:03
只需一部手机、无需美术功底或编程基础,就能在十分钟内完成一款游戏开发?杭州反舌鸟科技通过将AIGC技术深度整合进UGC平台,用1000万海外用户的真实数据给出了颠覆式答案,并成功吸引资本市场,完成2000万元A轮融资,估值飙升至2亿元。此次领投方包括美股上市公司联掌门户与A股电魂网络,跟投阵容更是囊括了杭州本土所有头部基金,显然都在押注这张“α世代索尼”的潜...
09:03
OpenAI 近期发布重要安全公告,确认其合作的第三方网络分析服务商 Mixpanel 遭遇了未经授权的网络攻击,导致部分 API 用户数据存在泄露风险。这一安全事件引起了广泛关注,OpenAI 迅速作出反应,在收到 Mixpanel 的紧急通知后,立即终止了与该服务的所有连接,以最大程度降低潜在影响。 根据 OpenAI 的详细说明,Mixpanel 服务...
09:03
英国国家教育研究基金会最新发布的一份重磅报告揭示了人工智能(AI)与自动化技术对就业市场的深远影响。预计到2035年,这两项技术可能将导致英国高达300万个“低技能”岗位消失。报告特别指出,技术工人、机械操作员以及各类行政职位将成为受冲击最严重的职业群体。然而,AI的崛起并非全然带来失业恐慌,反而将对高技能专业人才产生巨大需求。这一转变预示着未来劳动力市场的...
09:03
2025年11月27日,备受瞩目的2025亚洲通用航空展在珠海盛大开幕,吸引了全球通用航空领域的目光。中国航空发动机集团携旗下58型通航动力产品亮相展会,其中29型产品更是首次公开亮相,引发广泛关注。此次展会不仅集中展示了国内外通用航空与低空经济领域的最新成果,更彰显了中国航空工业在技术创新方面的卓越实力。 在动力系统领域,中国航发展现出强大的研发实力,成功...
09:03
育碧正式官宣,《刺客信条:影》将于2025年12月2日震撼登陆Nintendo Switch 2平台,为Switch 2玩家带来前所未有的开放世界冒险体验。本次登陆特别支持跨平台进度同步功能,让玩家能够无缝切换不同设备,持续追踪自己的游戏足迹,真正做到随时随地畅玩。 针对便携设备特性,《刺客信条:影》Switch 2版本进行了深度优化。无论是掌机模式还是底座...
09:03
2025年11月26日,香港大埔区宏福苑突发严重火灾,火势迅速蔓延,造成多人伤亡及大量财产损毁,现场惨不忍睹。面对这场突如其来的灾难,中兴通讯第一时间伸出援手,宣布向香港特区政府及相关部门捐赠500台5G云电脑,并承诺提供全程部署与技术支持服务。这一人道主义援助行动,旨在为受灾居民搭建起信息登记、紧急沟通和日常生活的桥梁,有力支持灾后重建与恢复工作。 中兴通...
09:03
2025年11月28日,育碧副游戏总监Simon Lemay-Comtois正式宣布了一项重要的战略调整,针对《刺客信条:影》的后续内容开发计划。他明确表示,公司不会为这款备受瞩目的游戏打造第二部规模堪比《淡路之爪》的大型DLC。这一决策背后,是育碧对玩家反馈的深刻洞察与积极响应。Simon强调,开发团队将彻底告别传统的季票模式,转而采用更小规模、更灵活的内...
09:03
2025年11月27日,微星正式推出一项名为“PBO BCLK Booster”的创新BIOS功能,专为AM5平台800系列MAX主板量身打造。这一功能旨在显著提升AMD Ryzen 7000/9000系列处理器的整体性能,据官方数据,性能提升幅度最高可达15%。通过精准调控板载时钟发生器,该功能能够智能优化CPU基频,为用户带来更流畅的计算体验。 “PBO...
08:28
REDMI产品经理胡馨心于11月28日透露了安卓版微信的一项重磅更新——聊天功能将支持发送实况照片。这意味着用户在发送照片时,可以选择附加动态画面和声音,让静态影像焕发全新活力。目前该功能正处于逐步推送阶段,部分用户可能需要耐心等待,但官方承诺很快就能与大家见面。 微信朋友圈早已率先支持发布实况图功能。用户在发布时可以选择关闭实况效果,实现静态照片与实况照片...
08:28
11月28日清晨7时45分,山东省威海市荣成市突发3.6级地震,震源深度达9千米。经专业测定,震中坐标位于北纬36.82度、东经122.16度,这一区域属于沿海地带,地质构造较为复杂。目前,当地相关部门尚未收到任何人员伤亡及财产损失的报告,这无疑为此次地震增添了一丝幸运的色彩。 面对这一突发情况,荣成市应急管理部门已迅速启动应急响应机制,第一时间组织专业团队...
08:28
2025年11月28日,天津市正式发布《“十五五”规划建议》,为未来五年城市产业升级擘画宏伟蓝图。这份由中共天津市委精心制定的规划,明确提出将加快推动信创、生物医药、新能源、新材料、航空航天等战略性新兴产业成长为城市支柱产业,形成多元支撑的现代产业体系。规划坚持高端化、智能化、绿色化发展导向,通过系统性布局新型工业化路径,同步推进传统产业数字化、智能化转型升...