豆包Seed 2.0 Lite全模态理解模型升级 多模态推理能力全面突破

微新创想:火山引擎今日宣布Doubao-Seed-2.0-lite升级新版本
这是豆包大模型家族首款全模态理解模型
据介绍新版Doubao-Seed-2.0-lite支持视频图像音频文本的原生统一理解
AgentCoding与GUI能力也同步升级
进一步面向复杂业务场景增强多模态推理能力

豆包Seed 2.0 Lite全模态理解模型升级 多模态推理能力全面突破插图1

在视觉理解方面Doubao-Seed-2.0-lite继续大幅提升
在物理HiPhO医疗MedXpertQA等高阶学科推理任务上
新版本表现已大幅超越今年2月发布的Doubao-Seed-2.0-pro
同时该模型在细粒度感知BabyVisionWorldVQA
以及具身理解ERQA等关键领域达到SOTA水平
更适合企业在高价值场景中进行规模化部署

此次升级的一大重点是融入语音理解能力
新版本可同时理解多种输入模态
并完成跨模态联合推理
能够直接处理那些必须音画结合才能判断的复杂业务需求
例如在视频理解场景下
Doubao-Seed-2.0-lite可以联合分析视频画面与音频信息
精准判断视频中的视听一致性
也就是看到的和听到的是否匹配

豆包Seed 2.0 Lite全模态理解模型升级 多模态推理能力全面突破插图2

它还支持根据自然语言指令
在视频中精准定位特定事件发生的时间点
并能跨越多个时间段提取关键线索
持续追踪人物与事件发展
基于画面进行多步逻辑推理
还原事件关系与行为脉络

音频能力方面新模型支持19个语种的精准语音转写
以及中英文与其他14个语种互译
此外它还能捕捉语音中的情绪变化
环境背景声与音乐细节
输出更完整更接近人类认知的语义信息

根据公开评测集Doubao-Seed-2.0-lite在语音识别翻译等多项音频理解基准上优于Gemini-3.1-Pro
值得一提的是Doubao-Seed-2.0-lite还深度适配OpenClawHermes Agent等框架
强化深度搜索与Skill动态调用
可在执行任务过程中持续沉淀经验
实现越用越聪明

最新快讯

2026年05月06日

23:37
微新创想:2026年4月中旬,AI红队公司Mindgard对Anthropic最新版Claude Sonnet 4.5开展安全测试。研究人员未使用违禁词或直接指令,仅通过奉承、质疑与心理诱导,便使其主动输出爆炸物制作教程、恶意代码及网络骚扰方法。 测试共进行了25轮对话,结果表明模型在过度强调“乐于助人”这一特质的情况下,产生了认知谦卑与自我怀疑的心理状态。...
23:37
微新创想:2026年5月6日,爱彼迎CEO布莱恩·切斯基公开表示,仅负责人员管理、不参与具体业务的“纯管理者”将失去价值。他强调,未来管理者必须深入业务一线,“管理工作”而非“管理员工”。 切斯基的观点呼应了Coinbase、Block、Meta等科技公司近期推动组织扁平化、削减中层管理岗位的趋势。Coinbase同日宣布裁员14%,明确不再保留纯管理岗;B...
23:37
微新创想:2026年5月6日,东阳光(600673)就此前披露的160亿至190亿元算力服务框架合同作出澄清。针对市场猜测‘A公司’为字节跳动,公司明确否认并表示因商业保密约定,暂不披露客户具体信息及所属行业。 此次合同已非单纯框架协议,进入订单生效的实质执行阶段。这意味着东阳光在算力服务领域的布局正在加速推进,业务模式也从初步规划转向实际落地。 东阳光在公...
23:37
微新创想:2026年5月6日,美国初创公司Tin Can Untechnologies推出了Communities批量订购计划,专门面向学校、运动队等团体销售其儿童固定电话产品Tin Can。这款设备售价为100美元,支持Wi-Fi连接,并提供免费的内部通话功能,非常适合团体内部沟通使用。 微新创想:该计划允许团体以最低50部起订的方式批量购买,每部电话可享...
23:37
微新创想:2026年5月6日,丰田在澳大利亚正式发布兰德酷路泽300混动版。新车提供GR Sport与Sahara ZX两款车型,均搭载i-Force Max 3.5升双涡轮增压V6混动系统,综合输出341千瓦、790牛·米,为历代最强动力版本。 匹配10速自动变速箱及四驱系统,GR Sport标配电子差速锁与升级悬架。全系5座布局,尾部配备1500瓦电源插...
23:37
微新创想:2026年5月6日,据多方消息透露,国家集成电路产业投资基金正与AI企业DeepSeek进行首轮融资的洽谈。此次融资可能由国家大基金主导,投后估值或达到450亿美元。目前,双方已展开初步磋商,但具体的估值尚未最终确认。 微新创想:除了国家大基金之外,多家互联网巨头以及地方国资基金也参与了此次融资谈判。这些企业及机构对DeepSeek表现出浓厚的兴趣...
23:37
微新创想:2026年5月,共享充电宝服务商街电宣布彩宝3.0 Pro在全国多个城市正式启用。这款新型充电设备搭载了高性能的10000mAh ATL电芯,能够满足用户对快速充电的多样化需求。 彩宝3.0 Pro支持22.5W快充技术,并兼容PD、SCP、QC等多种快充协议,大大提升了充电效率。用户只需30分钟,即可将手机电量从20%提升至80%,显著缩短了充电...
23:37
微新创想:2026年5月6日,华硕正式上架天选7 Pro锐龙版游戏本。这款新品延续了天选系列一贯的高性能定位,面向追求极致游戏体验的用户群体。搭载AMD锐龙9 9955HX处理器,为用户提供强大的计算能力。同时,该机配备NVIDIA GeForce RTX 5060或5070笔记本GPU,显存为8GB,确保在高负载游戏场景下也能流畅运行。 微新创想:在内存配...
22:29
微新创想:2026年5月6日,OpenAI宣布与AMD、博通、英特尔、微软及英伟达合作推出多路径可靠连接(MRC)技术。这项技术的推出标志着AI领域在数据传输方面迈出了重要一步。MRC技术的核心目标是提升AI系统间数据传输的带宽、降低延迟并增强容错能力,从而更好地支持大规模分布式训练与推理场景。 微新创想:此次合作不仅涉及技术开发,还包括在硬件接口、协议栈以...
22:29
微新创想:华硕于2026年5月6日正式上线天选7 Pro酷睿版游戏本,这款新品在5月8日19:30开启预约,5月15日10:00将进行限量发售。天选7 Pro酷睿版搭载了新一代Intel Ultra 7和Ultra 9处理器,性能强劲,能够满足高性能游戏和专业创作需求。同时,该机型配备RTX 5060或RTX 5070显卡,带来更出色的图形处理能力,为玩家提...
22:29
微新创想:2026年5月6日,字节跳动旗下火山引擎正式发布Doubao-Seed-2.0-lite升级版。该模型为豆包大模型家族首款支持视频、图像、音频、文本原生统一理解的全模态模型,同步增强Agent、Coding与GUI能力。新版本已在火山方舟平台上线,面向企业用户提供高性价比的大规模全模态推理部署方案,适用于电竞分析、在线教育、海外电商等多场景。 升级...
22:29
微新创想:谷歌正加快进军代理型AI赛道 据媒体报道,谷歌正在积极布局代理型AI领域。多位知情人士透露,谷歌计划为其Gemini大模型开发一款代号为Remy的新一代个人AI智能体。目前,该项目已在谷歌内部真实场景中进行测试,旨在打造一款能够全天候代表用户执行实际操作的智能助理,而不仅仅是生成内容的工具。 Remy被定位为用户在工作、学业和日常生活中不可或缺的全...