
微新创想:火山引擎正式发布豆包大模型2.0(Doubao-Seed-2.0)系列并同步上线API服务。个人用户可通过火山方舟体验中心或豆包App的「专家」模式进行体验。该版本针对大规模生产环境需求进行了系统性优化,具备高效推理、多模态理解以及复杂指令执行等能力,能够更好地应对真实世界中的复杂任务。同时,其推理成本相比业界顶尖模型降低了约一个数量级,日均Tokens使用量较推出初期已增长超500倍。
豆包大模型2.0提供了四款差异化模型,以满足不同场景下的延迟和成本需求。Pro版作为旗舰模型,专注于复杂深度推理和Agent等高难度任务。Lite版在整体能力上全面优于1.8版本,不仅能力有所提升,同时Tokens消耗更少,性价比突出。Mini版则以速度和成本为优先,其能力与1.6Pro版相当。Code版专为开发者优化,适配真实编程环境,与TRAE搭配使用效果更佳。
此次更新全面升级了多模态理解能力,在视觉理解领域达到了业界顶尖水平。Pro版在空间理解MMSIBench、运动理解MotionBench、视频理解VideoMME等测评中表现领先,甚至超过了Gemini3pro。图表理解CharXiv-RQ能力也得到显著提升。针对视频场景,模型强化了时间序列与运动感知理解,在TVBench等关键测评中表现优异,EgoTempo基准得分超过人类水平。在长视频评测中,模型超越了多数顶尖模型,能够实现实时视频流分析、主动指导等交互功能,适用于健身、穿搭等陪伴场景。此外,模型还能精准推理台球走位、识别运动动作并提供专业指导。

模型的LLM与Agent能力也实现了大幅强化。通过补充长尾领域知识,模型更好地适配专业场景任务。Pro版在SuperGPQA测评中得分超过GPT5.2,在HealthBench中获得第一,科学领域的成绩与Gemini3Pro、GPT5.2持平。HLE-text在测评中以54.2分领跑全球,IMO测评中超越Gemini3pro,工具调用和指令遵循等维度表现优异,STEM基准部分场景得分超过Gemini3Pro。
模型在指令遵循的一致性和可控性方面也有所增强,擅长处理长链路多步骤任务。能够完成“找资料-归纳-结论”的连续工作流,还能结合工具实现从数据处理、内容创作到生图排版的全流程任务。基于该模型构建的智能客服Agent,可实现客户对话、问题转接、售后回访等全链路服务,提升用户体验和运营效率。
此外,Code版模型可稳定调用主流IDE工具,前端能力优化显著,支持自定义技能。与TRAE结合使用,能大幅提升开发效率,仅需5轮提示词即可构建出“AI春节庙会”这类复杂Web应用。相关素材已开源,方便开发者进行二次开发和应用拓展。
为解决Agent时代Tokens使用量激增的问题,火山引擎同步更新了Coding Plan套餐包。开发者可在火山方舟平台上调用该模型,新用户首月最低仅需8元即可使用,实现不同编程任务的模型精准匹配。这一举措不仅降低了使用门槛,也提升了开发效率和资源利用率。
