阿里百聆语音模型升级:三秒录音多语言情感切换技术开源

阿里巴巴通义大模型近日正式宣布其“百聆”系列语音模型的重大升级,并惊喜推出开源版本。此次升级的两款核心语音模型——Fun-CosyVoice3与Fun-ASR,实现了令人瞩目的技术突破,能够在用户仅需三秒录音后,即可实现无缝切换至多达九种语言和十八种方言,覆盖普通话、粤语、日语、英语等主流语种,更可模拟多种情感表达,如开心、愤怒等复杂情绪,为语音交互注入了前所未有的生动性。

在此次升级中,Fun-CosyVoice3模型的表现尤为亮眼。其首包延迟大幅降低50%,中英混说的准确率得到了显著提升。更值得一提的是,该模型的音色克隆能力得到了质的飞跃。用户只需提供一段三秒以上的录音样本,便能精准复刻相应音色,并合成全新的语音内容。这一功能的推出,将极大推动实时语音助手、直播配音、无障碍阅读等场景的智能化进程,让语音交互更加高效便捷。

Fun-ASR模型同样实现了跨越式的进步。在噪声环境下,其准确率高达93%,表现堪称卓越。该模型不仅支持歌词和说唱的精准识别,更能实现多语言自由混说,全面覆盖多种中文方言与口音。为了进一步提升用户体验,流式识别的首字延迟已降低至160毫秒,显著增强了语音交互的流畅度与响应速度。

阿里百聆语音模型升级:三秒录音多语言情感切换技术开源插图1

为了促进技术的广泛应用,这两款模型均支持本地部署与二次开发。开发者可以根据自身需求进行定制化调整,充分释放语音技术的无限潜能。开源地址现已公布,用户可前往GitHub平台(https://github.com/FunAudioLLM/CosyVoice)体验和使用这两款强大的语音模型,共同推动语音技术在各个领域的创新应用。

划重点:
🌐 ** 多语言支持 **:三秒录音即可实现9种语言和18种方言的切换,打破语言障碍,畅享全球交流。
⚙️ ** 技术升级 **:延迟降低50%,准确率提升,使语音交互更加流畅自然,体验更上一层楼。
📦 ** 开源开放 **:模型支持本地部署和二次开发,便于个性化应用,助力开发者打造专属语音解决方案。

最新快讯

2025年12月26日

10:51
微新创想12月26日专讯 近日,备受瞩目的胖东来新乡三胖店盛大开业,迅速成为当地消费热潮的焦点,引得众多市民和球迷蜂拥而至。在这场购物盛宴中,一个特别引人注目的亮点位于三楼,一家专门展示足篮球星签名球衣的精品柜吸引了大量目光。该柜内陈列着包括梅西、姆巴佩、库里、乔丹在内的多位国际顶级球星亲笔签名的运动装备,每一件都附有清晰的价格标签,彰显其独特价值。 据店员...
10:37
2025年12月26日,vivo正式宣布OriginOS 6系统开启新一轮公测招募活动,此次覆盖vivo及iQOO两大品牌旗下共12款旗舰机型。据悉,用户报名通道已全面开放,报名截止时间为2026年1月4日23:59。本次公测将重点测试X Fold2、X90系列、S30系列、iQOO 11系列以及iQOO Z10 Turbo系列等热门机型。参与用户需确保手机...
10:37
2026年1月1日,中国将迎来电动汽车行业的重要里程碑——全球首部强制性的电动汽车电耗限值国家标准《电动汽车能量消耗量限值第1部分:乘用车》正式落地实施。这一具有划时代意义的举措,标志着中国在推动新能源汽车高质量发展和实现碳达峰目标上迈出了坚实一步。新标准根据车辆重量科学设定电耗限值,相比此前仅具参考性的推荐标准,整体要求严格了约11%,彰显了国家在新能源汽...
10:37
2025年12月26日,备受瞩目的配电行业领军企业法拉迪正式在新三板市场成功挂牌,标志着其发展历程中具有里程碑意义的时刻。作为配电领域的佼佼者,法拉迪长期致力于为电网运营商及终端用户提供全方位的配电自动化、配网自动化、电能质量优化及台区成套解决方案。此次成功上市不仅为法拉迪开辟了全新的融资渠道,更为其在技术创新和市场拓展方面注入了强劲动力,有望进一步巩固其在...
10:37
2025年12月26日,备受瞩目的医疗器械研发企业中科盛康正式在新三板市场挂牌上市,标志着这家专注于医疗设备研发与创新的高新技术企业迈入资本市场发展的新纪元。作为国内医疗器械领域的创新先锋,中科盛康始终致力于通过前沿科技推动医疗健康事业进步,此次成功挂牌不仅是对其技术实力与市场前景的权威认可,更为其未来发展注入强劲动力。随着企业正式登陆新三板,将有效拓宽融资...
10:37
2025年12月26日,通信行业迎来重大突破——新一代Cat.1 bis通信技术正式问世。这项创新技术以惊人的微安级功耗、紧凑的小尺寸设计以及全球统一的单SKU兼容特性,为物联网设备连接开辟了全新路径。Cat.1 bis技术核心亮点在于其带宽自适应机制,能够实时监测信号质量并动态调整码流参数,从而在保证传输效率的同时,显著增强弱网环境下的视频流畅度,让偏远地...
10:37
2025年12月26日,备受瞩目的精细化工企业犇星新材正式向北交所递交招股说明书,标志着其迈向资本市场的重要一步。作为行业内的创新力量,犇星新材深耕环保型PVC热稳定剂、农药原药及中间体的研发生产领域,致力于为全球市场提供高品质的化工解决方案。其核心产品线涵盖了硫醇甲基锡类热稳定剂,以及高效杀虫剂和杀菌剂类农药原药,在多个细分市场占据领先地位。 此次冲刺北交...
10:37
2025年12月26日,备受瞩目的苏州铁近科技正式向北交所递交招股书,标志着这家中国工业精密制造领域的领军企业迈向资本市场的新征程。作为国内首家成功实现工业级特微型轴承量产的企业,铁近科技凭借其卓越的技术实力和市场前瞻性,在高品质特微型精密轴承的研发与生产领域树立了行业标杆。通过持续的技术创新和自主研发,铁近科技成功突破了多项技术壁垒,构建了高度智能化的生产...
10:36
2023年以来,人工智能技术革命正以前所未有的速度席卷全球,Agent作为AI落地的核心载体,正在重塑各行各业的内容创作生态。在内容创作领域,创作者们正面临一场前所未有的挑战:每周投入20小时创作,却只能换来区区200个阅读量;选题枯竭、改稿至深夜、多平台适配效率低下——这些问题正在吞噬80%的创作时间。作为内容创作领域的先行者,Loomi深度洞察这些行业痛...
10:36
联想集团即将在 CES 大展期间重磅发布其首款面向全球市场的战略级 AI 应用——"AI 超级智能体"。这一举措标志着联想在 AI 应用领域全面发力,其目标直指近期备受字节跳动关注的"豆包手机助手"。尽管该智能体的官方名称尚未揭晓,但据联想内部知情人士透露,其功能复杂度与生态协同能力将远超豆包助手。 与市面上常见的单一语音助手不同,联想这款超级智能体被定位为...
10:36
HodlHer 近期成功斩获150万美元战略融资,吸引了包括Chain Capital、Bitrise Capital以及CGV在内的知名投资机构强势入局。这笔资金将全面赋能HodlHer核心技术平台HodlOS的迭代升级与生态拓展,重点强化其在情感交互、多智能体系统构建以及链上代理经济领域的创新实力,为下一代Web3操作系统的落地部署注入强劲动力。 Hod...
10:36
人工智能领域迎来历史性变革,OpenAI 与博通(Broadcom)达成战略合作,宣告传统“仅依赖 GPU”计算模式的终结。双方成功完成定制 AI 推理引擎的设计工作,这款革命性芯片预计将于 2026 年下半年率先进入数据中心应用。根据规划,未来五年内该合作将部署高达 10 吉瓦(GW)的强大计算能力,为人工智能产业经济格局带来颠覆性影响。 这项创新芯片的设...