阿里巴巴通义实验室正式开源新一代端到端语音交互大模型Fun-Audio-Chat-8B,这款模型以超低延迟、自然流畅的语音交互为核心,标志着开源语音AI进入全新阶段。它不仅能实时理解用户语音,还具备强大情感感知能力,性能直逼闭源巨头GPT-4o Audio和Gemini2.5Pro。AIbase独家解读:Fun-Audio-Chat并非简单聊天工具,而是真正意义上的“AI语音伙伴”。

image.png

用户只需开口说话,模型就能即时理解、思考并以自然语音回应,彻底摆脱传统ASR+LLM+TTS多模块拼接的延迟痛点,实现端到端Speech-to-Speech(S2S)架构,交互体验更接近真人对话。核心技术亮点超低延迟与高效设计:采用创新双分辨率架构(5Hz共享主干+25Hz精细头部),GPU计算资源节省近50%,响应速度大幅提升,适合实时场景部署。

富有同理心的情感理解:模型能从语气、语速、停顿等细节感知用户情绪(如开心、疲惫或愤怒),即使未明确表达,也能给出贴心、共情的回应,让交互更人性化。

强大语音函数调用:支持Voice Function Calling,用户通过自然语音指令即可执行复杂任务,例如“帮我打开音乐”或“拨打电话”,真正实现“动口不动手”。

image.png

领先性能表现在OpenAudioBench、MMAU、Speech-ACEBench、VStyle等多项国际权威基准测试中,Fun-Audio-Chat-8B同尺寸模型排名第一,综合能力超越GLM4-Voice、Kimi-Audio、Baichuan-Omni等开源竞品,部分指标已媲美或领先闭源顶级模型。丰富应用能力实时回答语音问题(如总结一段语音内容);

精准识别情绪、音色和命令;

支持多语言翻译、角色扮演;

模拟多种情感语音输出(如温柔、严肃、开心);

适用于情感陪伴、智能设备控制、语音客服等场景。

AIbase观点:此次开源包括完整8B模型权重、推理代码和Function Call示例,极大降低开发者门槛,推动语音AI生态快速发展。感兴趣的开发者可立即前往GitHub、Hugging Face或ModelScope下载体验,开启属于你的“高情商”语音AI时代!

项目地址:https://funaudiollm.github.io/funaudiochat/

最新快讯

2025年12月24日

17:02
南京666路公交车上上演一幕令人啼笑皆非的意外,乘客抬脚避让时裤腿竟被邻座大爷塑料袋中露出的带鱼鱼钩勾住,这场充满戏剧性的巧合被网友戏称为“被带鱼咬”,迅速引爆网络热搜。 据现场目击者周女士回忆,当时她正站在车厢中部,突然发现邻座大爷携带的黑色塑料袋中露出带鱼鱼头,下意识抬脚避让时,带鱼嘴部的鱼钩却精准地勾住了她的裤腿纤维,形成了一场“鱼与人的奇妙连接”...
17:02
哈尔滨冰雪大世界的超级雪雕"大雪人"最近意外走红,全靠一位东北小萌娃的脑洞大开。这位小朋友在拍摄雪人时,突然尝试从后脑勺角度取景,这种充满童趣的创意被家长拍下上传网络后,迅速引爆全网热议。与传统宣传片刻板呆板的推介方式不同,孩子们毫无造作的真实互动,不仅展现了冰雪文化的无穷魅力,更生动诠释了东北人热情豪爽的独特气质。 社交平台上,"萌娃带你看哈尔滨"的旅游攻...
17:02
今年黑五期间,POP MART的TikTok Shop团队将圣诞节的欢乐氛围完美融入直播间,通过「新品发售、阶梯式满赠优惠、48小时闪电发货」等密集福利,将节日庆典与黑五大促的喜悦推向高潮,更将顶级IP的魅力与圣诞节的温馨氛围在直播间呈现得淋漓尽致。这一幕只是POP MART在TikTok Shop跨境自运营(POP)模式下的精彩缩影。黑五期间,平台携手25...
17:02
声明:本文源自微信公众号《光子星球》,作者胥植,经站长之家授权转载发布。吉利汽车集团副总裁、吉利汽车研究院院长李传海在WAIC2025上公开表示"吉利有望从车企转变为中国乃至全球最大的机器人公司",这一观点引发外界广泛关注。外界惊讶之余,更多是认同。银河品牌助力下,吉利今年汽车销量全面爆发,前11个月总销量同比增长42%,新能源车增长97%,远超行业平均水平...
17:02
辽宁锦州近日发生一起令人瞠目的黄金盗窃案,一名男子家中价值不菲的100克黄金不翼而飞,引发社会广泛关注。案发后,受害者惊魂未定,其发小却主动提出陪同前往派出所报案,这一看似仗义的行为却暗藏玄机。民警在接警后敏锐察觉到异常,经过细致勘查与缜密分析,最终揭穿这起精心策划的“贼喊捉贼”闹剧,将犯罪嫌疑人绳之以法。 办案民警透露,受害者报案时,其发小全程陪同且表现异...
17:01
微新创想12月24日重磅消息,今年春季苹果正式推出iPhone 16e,起售价仅为4499元。这一新机型的问世,伴随着苹果从官网悄然下架iPhone SE的举动,预示着苹果将正式确立e系列作为独立产品线的战略布局,逐步取代原有的SE系列。根据行业惯例,明年春季苹果将迎来16e的迭代升级款iPhone 17e。知名数码博主定焦数码率先爆料,iPhone 17e...
16:49
元宝正式发布《元宝xDeepSeek年度报告》,全面揭示AI助手在真实场景中的深度应用与用户交互图景。报告显示,自2025年元宝接入DeepSeek的第315天起,这份年度数据报告为我们呈现了AI助手如何重塑用户数字生活体验。数据显示,当前元宝平台中超过三分之一DeepSeek对话能够持续两轮以上,用户在"深度思考"与"快思考"的交互模式中,后者占比高达七成...
16:26
上汽通用五菱重磅官宣,旗下首款“全能硬派大空间SUV”——星光560将于2026年1月震撼登场,正式开启预售。新车凭借其卓越的产品实力,将重新定义家用SUV的标杆标准。据悉,星光560将提供燃油版、插电混动版以及纯电动版三种动力选择,满足消费者多样化的出行需求。首发权益价区间设定在5.98万至9.88万元,极具市场竞争力。 新车整车尺寸长宽高分别为4745m...
16:26
2025年12月24日,中国人民银行携手交通运输部、商务部等八部门共同发布《关于金融支持加快西部陆海新通道建设的意见》,这份具有重要战略意义的文件提出了21条具体举措,为西部陆海新通道的加速发展注入强劲动力。意见明确指出,将着力完善金融组织体系与资金融通机制,通过创新金融产品与服务模式,构建更加高效的金融服务生态。特别值得关注的是,文件明确支持重庆设立陆海新...
16:26
2025年12月24日,台湾知名电子书平台Readmoo读墨正式宣布进军移动阅读新领域,宣布已启动手机型电子书阅读器的研发工作。这一战略举措旨在进一步拓展其市场版图,精准满足当下用户对于便携式阅读体验的迫切需求。值得注意的是,Readmoo近期刚刚推出了一款备受瞩目的7英寸mooInk Nana巧克力马丁尼新配色机型,该设备搭载了先进的元太Kaleido 3...
16:26
2025年12月24日,备受期待的《微软飞行模拟2024》迎来重磅更新,正式推出与经典科幻剧集《怪奇物语5》的深度联动内容。此次更新不仅为全球玩家免费开放下载,更以惊人的细节还原了1987年霍金斯小镇的独特风貌,让飞行爱好者们有机会从空中俯瞰这个充满神秘色彩的小镇。 本次更新精心还原了多个标志性地点,包括令人怀念的皇宫游乐场、充满怀旧气息的家庭录像带店等,每...
16:26
2025年12月24日,备受瞩目的具身智能领域创新企业格松科技正式宣布成功完成新一轮亿元级融资,此次融资由知名投资机构昆仲资本与英诺天使基金联合领投。这一重要里程碑不仅为格松科技注入了强劲的资金支持,更为其加速具身智能技术的研发与量产落地提供了坚实保障。作为专注于具身智能领域的先行者,格松科技凭借其前瞻性的技术布局和卓越的研发实力,在本次融资中赢得了资本市场...