字节跳动豆包大模型2.0上线 专家模式展现世界顶尖数学与推理能力

微新创想
今日字节跳正式发布豆包大模型2.0(Doubao-Seed-2.0)系列。此前,字节跳已推出Seedance 2.0视频模型和Seedream 5.0 Lite图像模型,此次豆包大模型2.0的发布进一步完善了其大模型产品矩阵。豆包2.0是针对大规模生产环境进行系统性优化的版本,旨在更好地完成真实世界的复杂任务,提升用户体验和应用效率。

目前豆包2.0 Pro已在豆包App、电脑客户端和网页版上线。用户只需在对话中选择“专家”模式,即可体验豆包2.0 Pro的强大功能。火山引擎也已上线豆包2.0系列模型的API服务,为开发者和企业提供更便捷的接入方式。

在语言模型基础能力方面,豆包2.0 Pro旗舰版展现出卓越的数学和推理能力。它在IMO、CMO数学竞赛和ICPC编程竞赛中取得金牌成绩,超越了Gemini 3 Pro在Putnam基准测试中的表现,达到世界顶尖水平。这表明豆包2.0 Pro在逻辑推理和复杂问题解决方面具备显著优势。

大模型执行长链路复杂任务,需要丰富的世界知识。豆包2.0在这一方面进行了显著增强,特别加强了长尾领域知识的覆盖。在SuperGPQA等多项公开测试集中,豆包2.0表现突出,其科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当,跨学科知识应用能力也位居前列。

字节跳动豆包大模型2.0上线 专家模式展现世界顶尖数学与推理能力插图1

在教育、娱乐、办公等众多场景中,大模型需要理解图表、复杂文档、视频等内容。为此,豆包2.0全面升级了多模态理解能力。在视觉推理、空间感知和长上下文理解等权威测试中,豆包2.0均取得了业界最佳表现,展现出强大的内容处理与理解能力。

面对动态场景,豆包2.0增强了对时间序列与运动感知的理解能力。它能够实现实时视频流分析、环境感知与主动交互,广泛应用于健身指导、穿搭建议、看护陪伴等生活场景。这种能力不仅提升了交互的智能化水平,也为用户提供更加精准和个性化的服务。

Agent能力是大模型具备行动力的关键。测试成绩显示,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶级水平。在HLE-Text(人类的最后考试)上,豆包2.0 Pro更是获得54.2的最高分,大幅领先于其他模型。这表明豆包2.0 Pro在复杂任务执行和自主决策方面表现优异。

在成本方面,豆包2.0 Pro按输入长度区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens。相比Gemini 3 Pro和GPT 5.2,豆包2.0 Pro具有较大的成本优势,为用户提供更经济高效的使用方案。

豆包2.0 Lite则更具性价比。其综合性能超越两个月前发布的上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元。这一版本适合对性能有较高要求但预算有限的用户,提供了更广泛的应用可能性。

最新快讯

2026年02月14日

20:22
微新创想:2026年2月14日,中国铁路12306技术中心就“长途有票、短途无票”现象作出说明。铁路实行“长途优先、兼顾中短途”的售票原则,通过票额预分、动态调整、敞开发售三个阶段来分配车票。这种机制有助于优化整体运力配置,确保长途旅客能够优先获得车票。 以G246次列车为例,21%的票额被预分给衡阳东等邻近始发站的车站。这样做的目的是为了满足短途旅客的基本...
20:22
微新创想:2月14日,千问官方就部分用户因未完成淘宝闪购授权导致免单卡领取失败一事作出回应,表示将于当晚完成系统补发。受影响用户可稍后进入活动页面,点击“去下单”并完成授权即可领取。 此次问题发生于“千问请客计划”第一波免单活动中,涉及范围为授权异常用户。千问方面解释,由于系统升级过程中出现的授权同步延迟,部分用户未能及时完成授权操作,从而影响了免单卡的正常...
20:22
微新创想:2026年2月14日,多名消息人士透露,三星Galaxy S26系列预售反响低迷,大量用户取消订单。据称,三星原定3400万台销量目标系基于早期乐观泄露信息制定,现因市场反应不及预期而面临严峻挑战。 该系列含S26 Ultra等机型,将提供钴紫色、星河蓝等配色,采用圆润边角与独立摄像模组设计,支持S Pen及5000mAh电池,并首发“隐私显示屏”...
20:22
微新创想:2026年2月14日,宇树科技创始人兼CEO王兴兴在接受央视财经采访时表示,当前具身智能技术仍处于较为初级的发展阶段,AI模型的泛化能力存在明显不足。他指出,在固定场景下,具身智能系统可以实现100%的成功率,但一旦遇到场景的微小变化,系统性能就会大幅下降。这种局限性使得具身智能在实际应用中面临诸多挑战。 王兴兴认为,整个行业尚未出现具有奠基性意义...
19:31
微新创想:2月14日17时48分,电影《飞驰人生3》全国预售票房突破1亿元。该片由韩寒执导,沈腾主演,定于2026年春节档(2月29日)正式上映。预售开启后迅速引发观众关注,单日预售额多次刷新同档期纪录。片方表示,影片延续热血喜剧风格,聚焦平民赛车手重返赛场的故事。此次破亿成绩创近年国产喜剧预售新高,反映春节档观影需求旺盛。
19:31
微新创想:2026年2月14日,字节跳动芯片研发团队宣布启动规模化招聘。此次招聘旨在加强在芯片设计领域的专业力量,推动自研芯片技术的进一步发展。 微新创想:该团队专注于芯片设计,特别是针对云端场景开发多款基于先进工艺的专用芯片。这些芯片的研发目标是显著提升算力性能,同时有效降低用户的使用成本。 微新创想:目前,多个芯片项目已经成功完成第一版流片,并进入量产部...
19:31
微新创想:2026年2月14日前,四川道孚—新都桥、广元火电两项500千伏输变电工程顺利投运。这两项工程由国网四川省电力公司建设,分别位于甘孜州和广元市。它们的建成不仅提升了当地的电力供应能力,还为清洁能源的高效接入提供了重要保障。 微新创想:工程主要服务于清洁能源接入与区域供电保障。随着四川地区可再生能源资源的不断开发,这些输变电设施在促进绿色能源并网方面...
19:31
微新创想:2026年2月14日 北京市住建委发布2026年首批城市更新计划项目清单 本次共纳入项目1321个 包括新实施项目745个以及2025年结转续建项目576个 年度计划投资总额达到1049.5亿元 项目覆盖了北京市所有行政区域 重点聚焦在老旧小区的改造 低效楼宇的升级以及街区环境的提升等方面 此次城市更新计划的实施 目的是为了更好地服务首都的高质量发...
19:00
微新创想:2026年2月13日,苹果美国官网正式下线iWork独立介绍页。访问该链接将重定向至通用的“Apple Apps”页面。这一变动标志着苹果正式结束以“iWork”品牌统称Pages、Numbers和Keynote三款办公应用的历史。未来,这三款应用的相关介绍将被整合进“生产力”板块,同时同步推广Creator Studio。 苹果此举表明其正在逐步...
19:00
微新创想:2025年8月,安全研究员Eaton Zveare发现印度达瓦药房(DavaIndia Pharmacy)后台存在一个未加防护的超级管理员API接口 该漏洞自2024年末起一直保持开放状态,未被及时发现和处理 攻击者利用此漏洞可以创建具有高权限的账户,进而访问大量敏感信息 受影响的订单数据包含客户的姓名、联系方式、地址以及药品详情等重要信息 此外,...
19:00
微新创想:2026年2月13日,OpenAI宣布为Codex、Sora等产品上线全新计费引擎。这一更新标志着OpenAI在服务管理与用户体验方面迈出了重要一步。新系统不仅整合了速率限制、实时用量追踪和信用点数扣减功能,还引入了更加智能的支付机制。 微新创想:用户在达到使用上限后,系统将自动切换至信用支付模式,从而避免了传统计费方式中常见的‘强制中断’问题。这...
19:00
微新创想:2026年2月14日,全球第二大黄金生产商Agnico Eagle Mines首席执行官Ammar Al-Joundi表示,公司财务稳健、运营高效,已准备好在出现合适机会时推进并购活动。这一表态显示出Agnico Eagle Mines在战略方向上的重要转变。 微新创想:过去多年,Agnico Eagle Mines主要致力于内生增长,通过优化现有...