阿里通义发布Fun-Audio-Chat端到端语音模型性能超越竞品开源8B版本

2025-12-23 18:38:50 快讯 1 次阅读

2025年12月23日，阿里巴巴通义智能实验室重磅发布新一代端到端语音交互模型——Fun-Audio-Chat，为语音技术领域带来革命性突破。该模型开源8B版本，凭借卓越性能在多项权威基准测试中脱颖而出，同尺寸模型综合排名第一，全面超越GLM4-Voice等主流竞品，再次巩固了阿里在AI语音交互领域的领先地位。

Fun-Audio-Chat采用创新的端到端S2S架构，实现了从语音输入到文本输出的全流程无缝转换，彻底摆脱传统多模态处理流程的效率瓶颈。其独特的双分辨率设计理念，通过智能分层处理机制，将GPU计算开销降低高达50%，在保证高性能的同时显著优化了资源利用率，为大规模应用部署奠定了坚实基础。

经过百万小时海量多任务数据的深度训练，Fun-Audio-Chat展现出惊人的泛化能力。模型不仅支持精准的情绪感知，能够根据用户语气变化动态调整回应策略，更实现了在自然语音指令下的复杂函数调用，真正做到了像人类对话般流畅自然。这种接近真人交互的体验，将极大提升智能助手在实际场景中的应用价值。

为了促进技术生态发展，阿里巴巴已将Fun-Audio-Chat的完整代码与预训练模型公开发布在GitHub、HuggingFace等主流平台。开发者可立即获取并基于此框架构建各类创新应用，共同推动语音交互技术的进步。这一开放举措标志着AI语音技术正迈向更加普惠、高效的全新阶段。

2025年12月23日

20:10

阿里通义发布Fun-Audio-Chat端到端语音模型性能超越竞品开源8B版本

最新快讯

2025年12月23日

紫光国微1-2亿回购股份用于股权激励彰显发展信心

华泰证券深度解析深海科技三大投资主线布局策略

“十四五”生态保护修复目标基本达成超过1.2亿亩面积修复成效显著

紫天科技年报季报披露受阻审计受阻

浩云科技1.74亿元算力组网合同签署构建高效算力网络

杰华特增资4000万立吉微至60%股权布局信号链领域

广西多地持续干旱水文中心发布预警及应对措施

亚信安全携手联通数科共筑网络安全新标杆

*ST信通终止天数智芯合作协议合作尚未实质性推进

深圳首单民营仓储物流REIT成功上市顺丰联合南方基金创32.9亿融资新纪录

上交所启用文档智能核验系统提升信息披露质量与效率

全国首台高端手术显微镜在哈投用赛过进口设备

阿里通义发布Fun-Audio-Chat端到端语音模型 性能超越竞品开源8B版本

最新快讯

2025年12月23日

阿里通义发布Fun-Audio-Chat端到端语音模型性能超越竞品开源8B版本