微新创想:近日,网易有道宣布“子曰”大模型迎来4.0版本的全方位升级。此次“子曰4”正式迈入全模态时代,不仅全面支持文本、图片、音频的融合交互,有道更宣布将核心的“多模态模型”与“语音合成(TTS)模型”正式开源。这一举措标志着公司在AI技术领域的进一步开放与共享。

微新创想:与此同时,翻译模型也迎来了深度的技术重构,翻译质量与效率实现双重提升。多模态模型在视觉与数理方面斩获SOTA,纯文本数理难题性能行业领先。据介绍,开源的“子曰4”多模态模型在27B参数规模上,面向教育场景,将支持视觉输入的数理能力拉到了行业顶尖水平。在同等参数规模的模型中,“子曰4”在处理带图表的数学题、物理题等高难度视觉数理问题上表现惊艳。中文纯文本数理难题的性能也获得显著提升,模型准确率达81.4%,达到行业领先水平。

微新创想:更为关键的突破在于实际落地的“性价比”。相关负责人介绍,新模型采用了精细化思维链重构方案,通过汇聚大规模优质精简的推理样本进行深度优化,成功将推理思维链输出长度压缩了43.2%。这意味着它可以用更少的Token、更短的推理路径更快地给出答案,为企业和开发者大幅降低了实际业务场景中的推理成本。

微新创想:此外,子曰研发团队针对国内学生真实的作业、考试和提问场景进行了深度优化,让它能够真正解决中国学生在实际学习中遇到的真实问题,成为更有温度的数字化助手。

有道子曰4全面开源多模态与TTS引擎实现SOTA数理与3秒情感克隆插图

微新创想:此次与多模态模型一同开源的还有语音合成(TTS)引擎。该引擎基于前沿的“语音编码器 + LLM”架构打造,面向开发者及内容创作者提供零样本、低门槛的语音克隆与情感合成能力。目前,它已全面支持中文、英语、日语、韩语、德语、法语、西班牙语、印尼语、意大利语、泰语、葡萄牙语、俄语、马来语及越南语共14种语言。

微新创想:系统可支持不同语言间同一说话者音色的自然迁移,无需额外训练即可保持音色一致性,且合成结果具备母语级别的自然度与流畅度,跨语种克隆也没有口音泄露问题。在声音克隆方面,子曰4实现了“上传即可克隆”的全量支持能力,用户仅需提供任意音频素材,系统即可在三秒内完成原声复制。

微新创想:据介绍,该引擎在克隆任务中的准确度超过97%,克隆音色与原声的相似度达85%以上。在保留说话人独特音色的同时,还可精准还原其情感色彩,综合能力达到该领域第一梯队。此外,该开源模型在真实多语言场景中展现出较好的稳健性,可应对日常对话、新闻播报、企业宣传等不同语境及复杂情感表达等多种合成需求。

微新创想:作为有道最为深厚的技术资产,翻译模型在本次升级中也迎来了重要的技术升级,使其在翻译任务中表现进一步提升。在数据层面,子曰团队收集并清洗了上亿级别的多语言数据,并聘请具有专八认证的专业人员进行多维度人工评估,从源头保证语料的高品质。

有道子曰4全面开源多模态与TTS引擎实现SOTA数理与3秒情感克隆插图1

微新创想:在算法层面,模型采用了创新的“多专家 OPD”模式,用一种更聪明的“软方式”博采众长,同时通过强化学习引入格式奖励和语言检测机制,有效解决了机翻常见的脱靶和语种混出问题。为了应对高频、高并发的产业级应用,升级后的翻译模型配备了高效的加速机制,使得整体推理速度直接飙升80%。

微新创想:配合大模型自动评测与人工随机抽检相结合的定制化方案,新一代翻译模型在文本、图片和文档翻译等多场景下,都展现出了兼具速度与质量的极高水准。

微新创想:回望有道在AI领域的探索历程,从最初子曰以首个教育垂直大模型姿态亮相、推出颠覆传统口语练习模式的“虚拟人口语教练Hi Echo”,到“子曰”2.0、3.0版本在软硬件生态中的全面扎根,有道始终走在AI赋能场景的最前沿。2026年,有道更是按下了应用落地的加速键,陆续发布了LobsterAI、有道宝库、有道同传Agent、Thinkflow等一系列AI Agent产品,实现了全场景AI Agent矩阵的前瞻性布局。

微新创想:“子曰4”的升级与核心模型全量开源,不仅大幅降低了开发者在多模态与语音合成领域的应用门槛,也向行业展示了以底层核心技术滋养上层Agent矩阵的生态闭环。有道希望,随着全球开发者与开源社区的共同注入,这一套全模态大模型生态将在更广泛的产业中激发出真正的生产力变革。

最新快讯

2026年05月21日

11:21
企业软件巨头Intuit近日宣布了一项大规模重组计划,预计将裁减约17%的员工,涉及人数超过 3000 人。这家以财务和税务软件闻名行业的巨头表示,此次裁员并非因为财务困境,而是为了全面调整公司架构,将核心资源全力倾斜至人工智能(AI)产品的整合与研发中。裁员重组聚焦AI战略Intuit首席执行官萨桑·古达尔齐在发给员工的内部备忘录中指出,公司需要通过简化组...
11:21
5 月 19 日至 21 日,人工智能及新能源自动驾驶领军企业——西井科技(Westwell)重磅亮相在德国汉堡举办的欧洲集装箱供应链展览会(TOC Europe 2026)。本次参展,西井科技以“AI LINKS GLOBE MOVES”为主题,不仅展示了其全球化战略的最新成果,更通过“智慧运力双旗舰”产品矩阵与基于世界模型打造的智能调度平台,向全球港口行...
11:21
微新创想:数学界迎来了一次具有里程碑意义的重大突破 OpenAI近日宣布其内部最新的推理模型成功生成了一份原创数学证明 正式推翻了由著名数学家保罗·Erdős在 1946 年提出的单位距离猜想 这一成果标志着人工智能首次依靠自身长链推理能力 自主攻克了数学核心领域的开放性难题 走出检索泥潭 专家独立验证 值得注意的是 就在七个月前 OpenAI曾因宣称解决多...
11:21
微新创想:大模型推理正在重新定义AI基础设施,网络架构创新成为释放硬件潜能的关键路径。2025年9月,智谱、驭驯网络与清华大学在网络领域顶级会议ACM SIGCOMM2025上发表了关于ZCube网络架构的研究成果。这一突破性架构不仅在理论上展现出卓越的性能潜力,更在实际应用中取得了显著成效。 微新创想:2026年5月21日,智谱宣布该架构已在GLM-5.1...
11:20
微新创想:人工智能巨头OpenAI的上市进程迎来实质性突破。据CNMB最新报道该公司最快将于本周五正式递交首次公开募股IPO招股书草案向资本市场迈出关键一步。首席执行官萨姆奥尔特曼表示希望公司最早能在2026年9月完成上市。 微新创想:法律障碍扫清顶级投行护航此前埃隆马斯克针对OpenAI发起了一系列诉讼一度对公司的治理结构和财务安排造成了潜在威胁。随着马斯...
11:20
微新创想:在人工智能视频生成的竞技场上,字节跳动视觉技术前负责人、爱诗科技创始人兼CEO王长虎无疑是当前最受关注的创业者之一。凭借极其高效的团队执行力和技术迭代速度,王长虎在短短六个月内斩获25亿元融资,带领爱诗科技迈入10亿美元估值独角兽行列,成为“字节系”创业者中的领军人物。 在巨头夹缝中突围:爱诗科技的“速度与激情”当前,AI视频生成赛道已进入“巨头集...
11:20
微新创想:荣耀手机今日正式宣布荣耀600系列即将登场。该系列手机搭载了教科书级护眼屏,不仅在显示效果上表现出色,还支持行业独家的纸质全彩模式,让用户在使用过程中感受到更真实的色彩还原和更自然的色温表现。 微新创想:为了提升用户在户外环境下的使用体验,荣耀600系列全系配备阳光模式。这一功能能够在拍照和取景时让画面更加清晰,即使在逆光环境下也能保证良好的可视性...
11:20
微新创想:美国东部时间5月20日 英伟达正式公布2027财年第一财季财报 本财季对应2026年2月至4月 整体业绩再度创历史纪录 财报数据显示 英伟达本季度总营收高达816亿美元 同比大涨85% 核心支柱业务数据中心营收表现尤为亮眼 创下752亿美元新高 同比增幅92% 环比同样上涨21% 同期边缘计算业务营收64亿美元 环比增长10% 同比增长29% 盈利...
11:20
微新创想:两周瘦了10斤,看着体重秤上的数字,22岁的小余还挺高兴。但很快,她就笑不出来了——头晕、恶心、频繁呕吐,呼吸急促,浑身乏力站不稳。被家人送到医院后,直接进了ICU。 浙江绍兴的小余,为了在夏天到来前快速瘦身,近半个月几乎不吃主食,每天只靠少量蔬菜和水果果腹。入院检查显示:血液酸碱度严重失衡,酮体浓度远超正常值,确诊为饥饿性酮症酸中毒。因病情危重,...
11:20
微新创想:二十四节气中,小暑、大暑,小寒、大寒,小雪、大雪,这些节气都成对出现,唯独“小满”没有对应的“大满”。这种现象背后有着深刻的原因。首先,“满”字在这里并非指完全的饱和或极致,而是象征着夏收作物如小麦的生长状态。小满时节,小麦的籽粒已经灌浆饱满,但尚未完全成熟,因此称为“小满”。当小麦真正成熟饱满,就到了另一个节气——芒种。芒种标志着农忙的开始,是收...
11:20
微新创想:夏天一到,一群人待在一起,蚊子偏偏只围着自己转。这时候总会有人问:你是不是O型血?其实,这是个流传多年的误区。蚊子根本分辨不出人的血型,没有任何科学依据能证明血型和招蚊子有关系。 蚊子选目标,主要靠嗅觉、体温和视觉。那什么样的人容易被盯上?第一类是呼出二氧化碳多的人。体型偏胖、肺活量高、孕妇、刚运动完的人,排放的二氧化碳更多,蚊子几十米外就能感应到...
11:20
微新创想5月21日消息 昨晚小鹏旗舰大六座SUV车型GX正式上市 限时起售价仅26 98万元 顶配也不过34 98万元 相较于预售直降5万元 这样的价格一出 让不少友商倒吸一口凉气 毕竟这款大湾区揽胜 给的实在太多了 而据官方最新数据 该车上市12小时大定达到了24863台 局部卖爆 GX长宽高分别为5265 1999 1800mm 轴距为3115mm 定位...