
微新创想
字节跳动正式推出原生全双工语音大模型Seeduplex
该模型基于“边听边说”的全新架构
彻底打破传统AI语音交互一问一答的局限
实现自然实时对话
目前Seeduplex已在豆包App全量落地
成为行业内首个规模化应用的全双工语音大模型
其核心突破在于改变了传统半双工听完再说的交互模式
真正实现了听与说的同步处理

该模型的两大核心能力得到重点突破
精准抗干扰
模型具备持续的倾听能力
从而能更好地理解用户所处的声学环境
准确忽略背景噪音和无关对话
在复杂场景下
相比半双工模型
其误回复率和误打断率减少了一半
动态判停
模型能联合语音和语义特征
综合判断用户意图
可实现更自然的对话节奏控制
面对用户的思考犹豫
模型能耐心倾听
在用户说完后
又能快速响应
相比半双工模型
其抢话比例相对下降了40%
多维度评测显示
Seeduplex在对话的流畅度和节奏感上
均显著优于传统的半双工方案及行业主流App的语音通话功能
在判停表现上
模型相比半双工方案提升了8%
展现出更接近自然对话的分寸感

对话流畅度MOS分提升12%
整体通话满意度提升8.34%
其打断响应表现已略优于真人对话平均水平
让人机交互更贴近自然交流状态
工程落地方面
该模型依托字节跳动自研LLM底座
通过架构创新、海量语音预训练、推理优化及稳定性保障
有效解决了高并发场景下的卡顿问题
可支持亿级用户稳定使用
目前用户更新至豆包App最新版
在打电话语音通话界面即可体验该功能
