通义实验室发布语音双模型Fun-CosyVoice3.5与Fun-AudioGen-VD实现自由语音生成

微新创想:通义实验室今日正式发布两款支持“FreeStyle”指令生成的语音大模型:Fun-CosyVoice3.5与Fun-AudioGen-VD。此次发布标志着语音生成技术从依赖预设标签的传统模式,向基于自然语言指令自由控制的新范式转变,实现了“一句话自由生成语音”的深度交互体验。这一突破为语音技术的应用场景打开了全新的大门,使得语音生成更加灵活、高效和富有创造力。

通义实验室发布语音双模型Fun-CosyVoice3.5与Fun-AudioGen-VD实现自由语音生成插图1

Fun-CosyVoice3.5在技术架构与功能升级方面表现出色。该模型特别注重多语种复刻与精细化表达,新增了泰语、印尼语等四个语种的支持。通过引入DiffRO与GRPO强化学习技术,Fun-CosyVoice3.5在语音的韵律表现和音质相似度方面有了显著提升。其生僻字读错率从15.2%大幅下降至5.3%,首包延迟也降低了35%,在语音生成的准确性和效率上实现了双重突破。

Fun-AudioGen-VD则专注于声音设计与场景化建模。该模型能够通过指令精确控制语音的性别、情绪以及空间声学效果,从而模拟出从“疯狂反派”到“热闹咖啡馆”等复杂且富有沉浸感的角色与背景音一体化场景。这种高度定制化的语音生成能力,使得Fun-AudioGen-VD在影视、游戏及虚拟角色创作等领域展现出巨大的应用潜力。

通义实验室发布语音双模型Fun-CosyVoice3.5与Fun-AudioGen-VD实现自由语音生成插图2

从行业趋势来看,通义实验室的这一发布不仅将语音生成从单纯的转换工具升级为创作工具,还为内容生产提供了更丰富的可能性。这种可描述、可编排的数字表达能力,有助于降低内容创作成本,同时极大拓展了人机交互的语义丰富度。无论是语音合成还是声音设计,用户都可以通过自然语言指令实现更精准、更个性化的语音生成需求。

未来,随着语音大模型技术的不断成熟,其在多个行业的应用将进一步深化。无论是娱乐产业还是人工智能领域,语音生成技术都将成为推动创新的重要力量。通义实验室的这一系列成果,无疑为行业带来了新的发展机遇,也为用户提供了更便捷、高效的语音创作体验。

最新快讯

2026年03月02日

12:34
微新创想:3月2日,掌阅正式发布iReader Tango 2 Pro墨水屏阅读器,将于3月10日开售,首发价1999元。这款设备采用手机形态设计,提供黑白双色版本供用户选择,兼顾了阅读器的便携性与现代手机的外观风格。 iReader Tango 2 Pro搭载了Carta 1300墨水屏,支持色温与亮度调节,能够根据环境光线自动优化显示效果,为用户提供更舒...
12:34
微新创想:2025年,小米以18%的市场份额位居全球可穿戴腕带设备出货量第一,这是自2020年以来小米首次重返行业榜首。这一成绩标志着小米在智能穿戴领域持续发力,成功巩固了其市场领导地位。 苹果以17%的市场份额紧随其后,排名第二。华为则以16%的市场份额位列第三,显示出强劲的竞争力。三星和佳明分别以9%和5%的市场份额占据第四和第五的位置,进一步体现了市场...
12:34
微新创想:3月2日11时45分,注册号B-659W的国产C919飞机从上海浦东飞抵广州白云机场,标志着南方航空第十架C919正式交付运营。至此,南航C919机队达10架,成为国内首家C919机队规模破十的航司。 微新创想:截至3月1日,该机型已执飞7800班,承运旅客超106万人次,通达17城,常态化商业航线达9条。首架B-919J于2024年8月投入广州—...
12:34
微新创想:2月28日,广州市南沙区在南沙国际会展中心召开高质量发展大会,发布“3+N”基金体系并集中签约45个优质项目,预计总投资347亿元。此次大会聚焦制造业与服务业深度融合发展,旨在加力提速推进区域经济高质量发展。该基金体系由3支母基金及N支子基金构成,重点支持战略性新兴产业、现代服务业及科技创新项目。签约项目涵盖智能装备、生物医药、数字经济等多个领域,...
12:34
微新创想:2026年3月2日,北京中科易微科技有限公司宣布完成Pre-A轮融资,由长兴基金独家投资。此次融资标志着公司在外泌体精准诊断领域迈出了重要一步。 微新创想:该公司专注于外泌体精准诊断技术,致力于肿瘤与神经退行性疾病的早期筛查及精准诊断。通过不断的技术创新,微新创想在该领域建立了深厚的研发基础。 微新创想:其自主研发的外泌体高效捕获与精准检测通用技术...
12:34
微新创想:2026年3月2日,具身智能企业影身智能宣布完成天使+轮融资。本轮融资由松禾资本、华樟基金、东莞科创及北京未来科学城基金共同投资。此次融资标志着影身智能在具身智能领域迈出了重要一步,为公司后续发展提供了坚实的资金支持。 公司聚焦空间大模型与工业场景机器人研发,致力于打造智能化解决方案。其核心产品和服务涵盖低成本、高可靠、模块化的软硬件协同系统,能够...
12:34
微新创想:近日,奎源精密完成B+轮融资,由欣和资本独家投资。此次融资标志着公司在高端制造领域迈出了重要一步,为未来的发展提供了坚实的资金支持。 该公司总部位于中国,专注于滚珠丝杠、行星滚柱丝杠及电动执行器的研发、制造与销售。凭借多年的技术积累和市场洞察,奎源精密在精密传动领域建立了良好的品牌影响力。 其产品已广泛应用于智能汽车、人形机器人、3C自动化、数控机...
12:34
微新创想:2026年3月,联想在MWC巴塞罗那展上发布了两款16英寸16:10便携显示器,分别是Lenovo L16和ThinkVision M16。这两款产品旨在提升用户的移动办公体验,满足不同场景下的使用需求。 Lenovo L16主要面向消费市场,具备1920×1200的分辨率,亮度达到300nits,确保在多种光照环境下都能呈现出清晰细腻的显示效果。...
12:02
微新创想:3月2日,奇瑞汽车正式发布瑞虎7L官图。该车定位为A级SUV,采用品牌最新设计语言,融合悬浮式车顶、半隐藏式门把手、V型黑色格栅、贯穿式尾灯及隐藏式排气等元素。前脸格栅与大灯无缝衔接,车身腰线凌厉,整体造型充满现代感。 微新创想:新车配备全景天窗、双色轮辋及黑色轮眉,进一步提升了视觉层次与时尚气息。这些细节设计不仅增强了车辆的辨识度,也展现了奇瑞在...
12:02
微新创想:2026年2月底 北京轻象模态科技有限公司宣布完成Pre-A轮融资 由三友科技独家投资 该公司专注于多模态人工智能技术研发与落地 核心方向包括视频理解 智能体任务意图识别等 借助这些技术 他们致力于提升人机交互的准确性与效率 本轮融资将用于加强核心技术研发 扩充算法团队 并加速行业场景商业化验证 这一资金注入为公司后续发展提供了坚实支撑 公司成立于...
12:02
微新创想:近日,深圳可立点科技完成A轮融资,投资方为力合科创。此次融资标志着公司在智能机器人领域迈出了重要一步,为其进一步推动产品化进程提供了坚实的资金支持。 该公司基于Robot+AI技术,研发出面向医院与康复中心的载人转运服务机器人。该产品不仅具备高度智能化的特点,还融合了多项前沿科技,包括SLAM导航、机器视觉等,能够实现精准定位与环境感知。 产品可在...
12:02
微新创想:2026年2月底,北京智澄英达科技有限公司(智澄AI)宣布完成Pre-A轮融资,由达泰资本、浙商创投联合投资。该公司成立于2024年3月,专注于大模型驱动的通用人工智能机器人研发。公司致力于构建能够理解物理世界的AI计算平台与实体机器人系统。其自主研发的通用AI机器人命名为TR(Transforming Robot)。TR机器人具备高度的智能化和自...