小米发布MiMo-V2-TTS语音合成大模型 支持多语种方言与情感表达

微新创想
今日小米发布Xiaomi MiMo-V2-TTS
这是小米自研的语音合成大模型
不仅能说、能演,还会唱

该模型基于自研Audio Tokenizer
和多码本语音-文本联合建模架构
经过上亿小时语音数据的大规模预训练
以及多维度强化学习
实现了高度可控的多粒度语音风格控制

MiMo-V2-TTS支持从整体风格定调
到局部情绪表达的精准调节
能够在同一句话内完成语气转折
和情感递变
真实还原人类说话的自然韵律

在唱歌时
也能准确表达音高和节奏
自然且富有表现力

为进一步激发模型在大规模预训练中
积累的高表现力语音生成潜力
小米还引入了多维度强化学习
兼顾稳定性与表现力

小米发布MiMo-V2-TTS语音合成大模型 支持多语种方言与情感表达插图1

模型在预训练阶段
通过大量文本-语音对齐数据
学习了书面语与口语表达之间的映射关系
能够智能识别文本中的各类格式信号
如标点符号、语气词、强调标记等

并将其自动转化为恰当、自然的语音表达
全程无需用户额外标注或手动干预

MiMo-V2-TTS还支持多种方言的自然发音
包括东北话、四川话、河南话、粤语、台湾腔等
可进行角色扮演式的风格化演绎
还能实现高质量的歌声合成

小米表示
MiMo-V2-TTS是其语音技术路线图上的重要里程碑
但绝非终点

在小米的规划中
中英文之外更多语种的覆盖
以及与 MiMo-V2-Omni 多模态理解能力的深度融合
让 Agent不仅能看懂世界、理解世界
更能以富有表现力的人类声音去讲述这个世界

最新快讯

2026年03月24日

08:38
微新创想:3月23日,科技媒体Android Headline曝光了Oura Ring 5智能戒指的渲染图及核心参数。这款新一代智能戒指在外观设计上进行了升级,采用更圆润的弧线造型,不仅提升了佩戴的舒适度,也增强了整体的美观性。同时,Oura Ring 5新增了‘深玫瑰色’这一配色选项,与原有的金、哑光黑及双工艺银色版本共同构成更加丰富的色彩选择,满足不同用...
08:38
微新创想:苹果公司将于2026年3月26日(周四)公布第7届Swift学生挑战赛350名获奖者名单。该赛事面向全球13岁以上在读学生,要求提交≤25MB、离线可用的交互式App Playground作品。评审聚焦创造力、社会影响力与包容性。 所有获奖者将获得一年苹果开发者会员资格、Swift认证考试资格以及定制证书。其中50位特别优秀的参赛者将受邀前往App...
08:38
微新创想:育碧宣布终止旗下成立近30年的红色风暴工作室的游戏开发职能 裁撤约105个岗位 该工作室将仅保留IT支持与Snowdrop引擎相关工作 此前 Red Storm正同步推进至少10个项目 包括《幽灵行动》续作 《细胞分裂》重启 《超越善恶2》及多款《彩虹六号》衍生内容等 此举系育碧全球成本优化计划一部分 后续更多削减措施预计在未来数周至数月内公布
08:38
微新创想:2026年3月24日,法国奢侈品牌爱马仕正式发布Paddock Yoyo旅行便携无线充电器。这款产品不仅在设计上独具匠心,更在材质与工艺上体现了品牌的高端定位。爱马仕采用Swift小牛皮打造这款充电器,同时运用了手工马鞍针工艺,使其外观精致优雅,兼具实用性与艺术价值。 微新创想:Paddock Yoyo的造型灵感来源于悠悠球,整体结构紧凑,便于携带...
08:38
微新创想:2026年3月起 微软将通过Windows预览体验计划 分阶段向用户推送Windows 11多项改进功能 首批更新已于3月下旬在Canary与Dev通道上线 涵盖可移动任务栏、Copilot精简、更新控制增强、文件资源管理器优化等 后续功能将持续按月推送 经可选累计更新验证后 再纳入每月第二个星期二的强制安全更新 此举旨在提升稳定性与用户可控性 回...
08:38
微新创想:2026年3月24日,OpenAI发言人公开表示,微软当前及未来均是其至关重要的长期合作伙伴。此次声明发布于美国加州,标志着人工智能领域两大核心企业之间关系的进一步巩固。合作内容涵盖云计算、模型部署与产品集成等多个方面,双方希望通过深化合作加速人工智能技术的实际应用与落地。 微新创想:此次合作不仅限于现有业务范围,还涉及未来技术发展的多个层面。微软...
08:38
微新创想:Anthropic 于 3 月 24 日宣布旗下 AI 助手 Claude 新增“Computer Use”功能。该功能目前以研究预览版形式向 Pro 和 Max 用户开放。这项功能主要集成在两款桌面产品中:面向知识工作者的 Claude Cowork 以及面向开发者的 Claude Code。用户只需描述任务,Claude 就会自主规划操作步骤,...
08:07
微新创想:2026年3月24日,丰田汽车北美公司宣布将向美国肯塔基州和印第安纳州的工厂投资10亿美元。这项投资由丰田主导,主要目的是提升工厂的产能以及电动化零部件的生产水平。 此举是丰田在2025年11月公布的五年计划的一部分。根据该计划,丰田将在未来五年内追加投资100亿美元用于美国市场。此次10亿美元的投资是该计划的首批落地项目之一。 投资资金将用于设备...
08:07
微新创想:近日,三亚市交通运输局通报一起出租车司机违规事件。3月23日,一名乘客通过滴滴平台预约了巡游出租车(车牌号为琼BD09915),在行程途中,司机未经乘客同意擅自停车,试图搭载其他乘客。该行为遭到乘客拒绝后,司机继续完成原定行程。乘客随后向相关部门投诉,事件引起了广泛关注。 微新创想:经核查,该司机的行为严重违反了出租车运营服务规范,损害了乘客的合法...
08:07
微新创想:2026年3月23日,苹果公司在WWDC26官方新闻稿中罕见预告将重点发布人工智能新进展。大会定于2026年6月在加州圣何塞举行,面向全球开发者。苹果明确表示,iOS 27、iPadOS 27等系统将从底层集成多项AI突破,升级后的Siri将成为核心亮点。 尽管部分AI功能或随iOS 26.5提前上线,但WWDC26将首次系统性展示其与谷歌Gemi...
08:07
微新创想:2026年1至2月,新疆霍尔果斯口岸出口商品车5.4万辆,同比增长13.9%,创历史同期新高 出口目的地主要为中亚五国及俄罗斯,新能源汽车成主力品类 当地货运代理企业新增海外服务站,获多家车企授权 霍尔果斯海关推行24小时通关、自驾出口快速模式,并联动中欧班列等多元运力,压缩全链条通关时间,保障国产车高效出海
07:33
微新创想:2026年3月17日,前苹果工程师Akira Nonaka在其YouTube频道发布了一段摄于1999年7月27日的内部视频。这段珍贵的影像资料记录了乔布斯在纽约Macworld大会之后,于库比蒂诺苹果总部发表的讲话。视频内容详尽地展现了苹果当时所推行的“四象限”产品战略,包括iMac、Power Mac G3、PowerBook G3和iBook...