豆包大模型发布全双工语音技术Seeduplex,活人感引领语音交互新变革

微新创想:豆包大模型,又上新了。2026年4月9日,原生全双工语音大模型Seeduplex正式发布。相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。

依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放自如的聊天搭子,活人感跃然纸上。显而易见,AI应用“一哥”如虎添翼了。

活人感才是语音交互的核心竞争力。语音交互,成为互联网竞争的主战场。起初,人类触达数字世界交互方式为命令行;之后,图形界面接棒,造就了PC的辉煌;等到触控起势,移动互联网的序幕也随之拉开。如今,交互方式又有了新范式。AI时代,语音交互走到了C位,不再是一个可有可无的辅助功能,而是提升交互效率、改变交互形态的核心载体。皆因,语言才是人类表达意图的最短路径。如此一来,基于AI技术的语音交互正在打破现实世界与数字世界的交流壁垒,通过颠覆使用习惯的方式完成交互跃迁。

问题在于,传统的语音交互是半双工模式。半双工模式之下,同一个时间段内只有一个动作发生,用户说话了则AI只能听着,反之亦然,这个过程一板一眼,不容丝毫偏差。通俗易懂地说,AI在语音交互的过程中缺乏活人感。此背景下,哪怕语音识别与自然语言理解两大技术成熟,语音识别准确率接近人类水平,也没有让传统的语音交互出圈。

一名互联网观察人士告诉锌刻度:“半双工模式无法打断正在进行的说话、难以过滤复杂环境的杂音、没法感知用户的正常停顿等,容易出现抢话、跑题等令人尴尬的问题,严重影响了用户的交互体验,直白地说就是AI彬彬有礼却无法与用户共情。”

Seeduplex的全双工模式,则有效解决了上述问题。全双工之下,同一个时间段内用户与AI可以双向交流,即用户可以随时插话与打断,AI也可以持续倾听与及时响应。在此过程中,Seeduplex进行全局声学环境感知,精准筛选出用户与模型交互的真正声音,过滤背景带来的各种干扰声,从而将误回复率与误打断率降低了一半,用户无需提高音量或寻找安静角落,即可进行高质量的对话。

精准抗干扰之外,Seeduplex还具备动态判停能力。通过联合语音和语义特征,综合判断用户意图,面对用户的思考犹豫,模型可以耐心倾听;在用户说完后,又可以快速响应,从而抢话的概率相对降低了40%。对此,一名专业人士表示:“通过语速、语调、语义的综合考虑,动态判停可以共情式倾听用户,理解用户的停顿到底是在思考,还是真正把话说完了,这才是Seeduplex最大的竞争优势。”

豆包大模型发布全双工语音技术Seeduplex,活人感引领语音交互新变革插图1

一言以蔽之,Seeduplex成为一个有温度、有深度、有人格、有灵魂的交互主体,依托活人感走了一条差异化竞争的道路。毕竟,活人感才是语音交互的核心竞争力。

率先突破的为何是豆包全双工模式堪称降维打击,自然成为行业追逐的焦点,可唯独豆包大模型成为行业“吃螃蟹”的第一人,并非偶然。一方面,语音交互一直是豆包的底色。自推出以来,语音交互就成为豆包用户体验的核心支柱,其即时互动感颇受年轻人的青睐,进而营造了高粘性、正循环的社交氛围。由此一来,豆包成为AI应用赛道的“一哥”。

QuestMobile的数据显示,截至2025年9月,AI应用市场移动端、PC端月活跃用户数分别达到7.29亿、2.00亿;其中,排名第一的豆包的月活跃用户规模为1.72亿。华熙生物董事长赵燕表示:“豆包这些AI,是生活的一部分,工作的一部分。重复、需要耗时耗力的一些事儿,我会让豆包来做。AI给我们带来的是业务的重塑,原来可能几十个人的团队要干两年,现在可能(只需要)五个小时。”

正因为如此,豆包的语音交互生态每天都在源源不断产出海量的真实数据,为孵化Seeduplex提供了肥沃的土壤,其训练语料的优势无法比拟。

另外一方面,豆包大模型的底蕴深厚。豆包大模型2024年5月的日均Token使用量为1200亿,到了2026年3月日均Token使用量已突破120万亿,足足增长了1000倍。须知,Token使用量是衡量AI发展速度的核心指标。这意味着,豆包大模型不断技术迭代,从可用走向好用,为半双工豆包端到端语音模型迭代为原生全双工语音大模型Seeduplex创造了良好的条件。

火山引擎总裁谭待表示:“只有大的调用量,才能打磨出好模型。只有在真实场景中落地,用的人越多,调用量越大,模型才会越来越好。”

具体来看,为了让全双工成功落地,Seeduplex在模型框架设计、算法优化、工程性能与稳定性上下了一番功夫。譬如,在模型框架设计上,放弃了经典的“ASR(语音转文本)→LLM(大脑思考生成回复)→TTS(语音合成)”模型架构,设计了更贴合语音实时对话原生特性的模型架构,使模型能够直接从数据中学习语音与语义的一体化表达和节奏控制,显著提升了交互自然度。

再譬如,活人感与对话智能、超低延迟、对话节奏控制、强抗干扰能力与指向性理解等指标息息相关,因而需要依托海量语音数据进行大规模预训练,并通过多能力、多任务的后训练体系,才可以达到多维能力协同进化的目的。

豆包大模型发布全双工语音技术Seeduplex,活人感引领语音交互新变革插图2

合力之下,Seeduplex攻克了全双工语音的数据构建、超低时延与模型效果协同优化等核心技术难题,打开语音交互的新边界。测试数据显示,相比上一代半双工豆包端到端语音模型,Seeduplex的判停MOS分提高了8%,对话流畅度MOS分提升了12%。

智能座舱迈入语音交互时代。随着语音交互从半双工走向全双工,可以进一步赋能教育、直播、营销、客服等行业,释放更大的生产力。上述行业有一个共同的特征,即在语音交互的过程中需要避免机械感,从而增加用户的沉浸感与参与感,最终提高用户的信任度与满意度。

不难看出,Seeduplex的出现不啻一场及时雨。尤为值得一提的是,随着汽车全面拥抱智能座舱,汽车正在撕下代步的标签,成为真正意义上的“第三空间”,也成为语音交互落地的最佳场景。事实上,无需触控、按键、旋转,通过口头指令即可控制打开音乐、降低车窗、调整温度、设置导航等日常操作,因而语音交互逐渐取代了传统的人机界面。

不难看出,语音大模型成为智能座舱比拼的关键所在。佐思汽研的数据显示,车载大模型2025年1月的渗透率为10.8%,到了2025年12月已攀升至38.6%,走高的势头肉眼可见。其中,豆包大模型拔得头筹。

公开资料显示,豆包大模型覆盖赛力斯、吉利汽车、长城汽车、捷途汽车、智己汽车等20余家车企,2025年新上市车型搭载量位居行业第一。以别克至境E7为例,其与豆包大模型进行了全链路共创模式,在高速噪声、多音区等复杂环境下,将语音识别准确率提升至98%,复杂指令理解超过95%。

火山引擎汽车总经理杨立伟表示:“我们的合作,不是‘大模型上车’,而是‘大模型为车定制’。”

眼下,Seeduplex助阵,豆包可以更好地适配智能座舱场景,既能在低延迟条件下实现对话,克服听不准、听不清、反应迟钝等传统痛点,也能通过用户的语调、语速、语义,判断用户的情绪,并给出积极的回应,成为一个可以提供情绪价值的开车搭子。

简而言之,豆包从助手化身为助理。与此同时,在Seeduplex赋能之下,智能座舱可以“像人一样思考、像人一样交流、像人一样成长”,有了更大的想象空间与商业价值。

总而言之,全双工语音技术走出了实验室,全面领先当下主流的半双工语音技术,未来不但会重新定义AI应用的用户体验,还可能孕育全新的语音交互商业模式。那么,豆包有了更大的势能。

最新快讯

2026年04月16日

13:15
微新创想:4月14日至15日,格力市场总监朱磊连续发文质疑海信空调无权宣称“真铜实料”,并追问其是否全系家用空调均采用铜管两器及铜线电机。海信空调品牌总监杨祥玺随后回应,晒出拆机视频称格力部分机型使用铝线电机。双方围绕材料真实性、宣传合规性及行业标准展开公开辩论。 事件发生于中国家电市场竞争加剧背景下,焦点直指核心部件用材透明度与营销话术边界。消费者对产品材...
12:42
微新创想:4月10日起,夸克网盘全面清查用户存储的美剧、韩剧、泰剧等无版权海外影视资源,大量公开分享链接失效。部分搬运博主紧急提醒用户于23点前下载或转存,否则将被自动清理。 此举系落实四部门联合开展的“剑网2025”专项行动,重点强化网络存储与传播领域版权监管。相关整治自2025年5月启动,覆盖视听作品、动漫游戏、软件、电商销售及流媒体终端等多个方向。 此...
12:42
微新创想:2026年4月14日,三星电子在美国内华达州拉斯维加斯举办的CinemaCon 2026大会上正式推出14米版Onyx电影LED显示屏。这款产品标志着三星在数字影院显示技术上的又一次重大突破。其采用3.3mm像素间距,能够实现更加细腻的画面表现,满足高分辨率需求。 该显示屏支持4K 120Hz播放,带来流畅无拖影的视觉体验。同时具备2.39:1与1...
12:42
微新创想:4月15日,美国纽约联邦法官拉科夫裁定,被告布拉德利·赫普纳与AI助手Claude之间的31份对话记录需提交检方。该决定基于这些对话不构成律师—客户关系的认定。此案引发了对AI交互在法律程序中保密特权适用性的广泛关注。 此判决凸显了当前AI技术在法律领域应用过程中可能带来的隐私与保密风险。随着越来越多的律师和法律从业者开始使用AI工具来辅助案件分析...
12:42
微新创想:2026年4月,生活机器人及健康产品研发商皮皮熊宣布完成数千万人民币A轮融资。本轮融资由辰德资本、苏高新联合领投,金沙江创投等老股东跟投。公司总部位于中国,专注服务老年人群的智能机器人与健康产品研发。融资将重点投入辅助出行类新产品的技术研发与市场推广,以提升老年用户居家及户外行动安全性与便利性。本轮为公司首次对外公开融资。
12:42
微新创想:2026年4月16日,科技媒体Android Authority在Android Canary 2604版本代码中发现原生双卡差异化铃声功能线索。这一发现意味着安卓系统即将迎来一项重要的新特性。 该功能允许用户为不同SIM卡(包括eSIM与实体卡)独立设置专属铃声。这意味着用户可以针对每张SIM卡选择不同的来电提示音,从而更轻松地识别来电来源。对于...
12:11
微新创想:近日,美国Bloom Energy公司宣布与甲骨文(Oracle)达成战略协议,首期采购1.2GW固体氧化物燃料电池(SOFC),用于加速数据中心能源基础设施建设。该项目是总规模2.8GW合作的一部分,当前已进入部署阶段。此举反映美国数据中心用电需求激增背景下,过渡性清洁能源方案加速落地。 微新创想:随着全球数字化进程不断加快,数据中心的能耗问题日...
12:11
微新创想:2026年4月15日,摩根大通上调零跑汽车(HK09863)2026/27年度盈利预测10%-17%,目标股价由56港元提至90港元。这一调整反映出市场对零跑汽车未来发展前景的信心增强。 截至周三收盘,零跑汽车股价报54.4港元,较一个月前上涨约27%。股价的显著回升表明投资者对公司近期表现及长期增长潜力的认可。 机构认为零跑汽车仍有65%的上行空...
12:11
微新创想:4月16日,动画电影《小猪佩奇·完美假期》发布“闯中版”预告,正式宣布定档2026年暑期档。这部影片是小猪佩奇IP系列中首部采用三维动画形式的大电影,由英国原班制作团队倾力打造。影片中,佩奇与乔治将以全新的三维形象踏上中国之旅,开启一段充满欢乐与惊喜的假期冒险。同时,全新角色伊菲也在预告中首次亮相,完成银幕首秀。 影片围绕家庭旅行展开,重点描绘了小...
12:11
微新创想:2026年4月14日19时,上海丝芭文化传媒集团有限公司创始人王子杰先生因突发心源性疾病,经抢救无效在上海逝世,享年63岁。 王子杰先生1963年出生于上海,是一位兼具学术背景与商业远见的杰出人物。他毕业于复旦大学数学系,后赴日本同志社大学深造,获得工学硕士学位。在学术与实践的结合中,他展现出非凡的洞察力和创造力。 在职业生涯中,王子杰先生曾主导引...
12:11
微新创想:2026年4月16日,博主@40在跑车爆料称,鸿蒙智行已规划问界M9L车型,定位为行政级大型SUV,车长预计将达到5.4米。这一消息引发了广泛关注,显示出鸿蒙智行在高端车型布局上的进一步拓展。 同月,工信部第405批新车公示显示,全新一代问界M9的尺寸为5285×2026×1845mm,轴距为3125mm,相比现款车型有所增加。这表明问界M9在设计...
12:11
微新创想:2026年4月16日,万事达卡与境内清算机构万事网联宣布,中国境内发行的万事达卡品牌银行卡即日起支持Apple Pay跨境交易。这一更新标志着中国持卡人可以更加便捷地使用Apple Pay进行国际支付。 微新创想:中行、农行、中信银行、浦发银行发行的万事达单/双品牌信用卡,以及中信银行万事达借记卡用户,现在可以通过各自的银行App将卡片添加至App...