字节跳动发布全模态大模型Doubao-Seed-2.0-lite AI听看懂还能动手操作

字节跳动发布全模态大模型Doubao-Seed-2.0-lite AI听看懂还能动手操作插图1

微新创想:字节跳动旗下火山引擎于5月6日宣布豆包大模型家族正式迎来首款全模态理解模型——Doubao-Seed-2.0-lite。作为该系列的重磅升级版本,新模型彻底打破了单一模态的限制,实现了视频、图像、音频与文本的原生统一理解,标志着其在多模态交互领域迈出了关键一步。

字节跳动发布全模态大模型Doubao-Seed-2.0-lite AI听看懂还能动手操作插图2

新模型在视觉与逻辑推理能力上表现尤为亮眼。在物理、医疗等高阶学科的复杂推理测试中,其性能已大幅超越今年2月发布的Pro版本。而在细粒度感知以及具身理解等前沿领域,该模型更是达到了行业领先水平。

字节跳动发布全模态大模型Doubao-Seed-2.0-lite AI听看懂还能动手操作插图3

通过融入语音理解技术,Doubao-Seed-2.0-lite 能够实现“音画同步”的深度联合推理。这意味着它不仅能“看懂”视频画面,还能结合背景音频精准判断视频内容的视听一致性。甚至能根据指令在长视频中精准定位特定事件,并还原复杂的人物关系脉络。

字节跳动发布全模态大模型Doubao-Seed-2.0-lite AI听看懂还能动手操作插图4

在音频处理层面,新模型展现了极高的翻译与感知精度,支持包括中英在内的19种语种转写及14个语种的互译。除了精准的语义识别,它还能敏锐捕捉语音中的情绪波动及环境背景声,使其理解能力更接近人类的自然认知。

值得关注的是,Doubao-Seed-2.0-lite 的 Agent(智能体)与 Coding(编程)能力也同步完成了进化。模型对多轮复杂指令的遵循度显著提升,具备了更强的自我拆解与校验能力。在开发领域,它的代码能力已覆盖前端页面、3D场景及游戏开发,能够交付视觉美观且工程完整的产物。

此外,该模型首次实现了GUI(图形用户界面)理解与执行的一体化。它不仅能识别网页或应用中的按钮、菜单等元素,还能像真人一样完成点击、拖拽、输入等操作,真正实现了从“读懂界面”到“端到端交付任务”的闭环。

目前,这一技术已在电竞复盘、在线教育及跨境电商等多个领域落地。例如在电竞场景中,AI可以作为教练,连续分析长达25小时的比赛视频与语音,自动生成战术复盘图谱。与此同时,更高效的 Doubao-Seed-2.0-mini 版本也已同步上线,为企业大规模、低成本部署全模态推理任务提供了更具性价比的选择。

最新快讯

2026年05月07日

09:49
微新创想:马斯克今日在X平台发文宣布,旗下人工智能公司xAI将终止独立运营,整体并入SpaceX并正式更名为SpaceXAI。这一决定是针对特斯拉投资者关于SpaceX与Anthropic公司签署协议的提问作出的回应。投资者指出,Anthropic已获得SpaceX Colossus 1大型数据中心超过300兆瓦的算力资源,同时表达了与SpaceX合作开发数...
09:49
微新创想:2026年4月底 抖音悄然推出星光商城 2026年4月底 抖音在站内悄然推出星光商城 此次推出的星光商城首次在聊天场景中引入纯付费增值模式 该商城主打聊天气泡和专属表情两类装扮商品 用户需使用平台虚拟币星光付费购买 在此之前 抖音聊天中的皮肤 表情等装饰元素主要通过免费领取 活动任务或粉丝福利等方式发放 此次付费功能的上线 被视为抖音社交生态建设中...
09:49
微新创想:近日上海发生一起令人震惊的情侣盗窃案。一名女子趁男友熟睡时,利用人脸识别功能解锁手机,在长达三个月的时间里,共进行了21次转账操作,累计转走27万多元。案件由上海普陀警方披露,受害人为欧先生。他在最近准备使用资金时,发现账户余额异常,经仔细核查后才意识到自己的账户被悄悄盗刷。 警方在调查过程中发现,所有转账操作均发生在凌晨时段。结合欧先生与女友邵某...
09:49
微新创想:五一假期期间,餐饮行业的临时工日薪普遍上涨至300至500元。然而,随着假期客流的激增,人员流动性大、工作强度高,导致许多小店在运营过程中面临订单出错、人手不足等问题,给经营者带来了不小的压力。 在长沙,一位小吃店老板娘在节日期间意外收获了一位得力助手,她的10岁儿子。这名小男孩不仅主动承担洗菜、上菜、打扫等基础工作,还利用自己对人工智能的兴趣,尝...
09:49
微新创想 43岁的刘先生(化名)怎么也没想到一次普通的外出旅游会让他陷入生死危机。2025年9月他刚结束北京之行准备返回上海在车站附近吃了一碗手擀面。面偏硬吃完没多久他就开始感到上腹部不适。起初他并未在意以为只是旅途劳累加上吃撑了休息一下应该就好了 然而回到上海后情况并未缓解从深夜到凌晨疼痛越来越重腹胀越来越明显。他试着催吐想把吃坏的东西吐出来又赶紧服下...
09:49
微新创想:近日在河北唐山发生了一起令人啼笑皆非的马场事件。一匹身价高达170万元的优质种公马因不愿配合上车而引发了一场追逐风波。马场工作人员原本计划将这匹名贵公马进行转运,但公马始终不听指挥,拒绝上车。为了安抚它的情绪,工作人员牵来一匹母马试图引导公马配合行动。 不料母马突然挣脱缰绳开始奔逃,公马见状立刻表现出强烈的追随欲望,不顾一切地追了上去。这一幕被网友...
09:49
微新创想:谷歌近日对其生成式AI搜索功能(SGE/AI Overviews)进行重大升级 旨在通过整合社交媒体、论坛及新闻订阅等一手信息源 优化用户获取信任资讯的效率 此次更新最显著的变化在于引入“观点预览”功能 将Reddit、各类网络论坛的真实在线对话与用户查询直接关联 谷歌官方指出 这一举措顺应了用户日益倾向于寻求真实经验而非过度SEO优化内容的趋势 ...
09:18
微新创想:美的集团于2026年5月7日发布公告,宣布计划通过其全资境外子公司美的投资发展有限公司,在境外市场发行两批零息有担保可转换债券,总金额达172.48亿港元。此次发行包括两期债券,分别为2027年到期和2033年到期,每期金额为86.24亿港元。所有债券均以H股作为转股标的,意味着投资者在债券到期后可以选择将债券转换为美的集团的H股股票。 公司表示,...
09:18
微新创想:出差期间去会所等按摩时突发疾病去世,这算不算工伤?近日,内蒙古一起真实案例的判决结果引发了广泛关注。去年3月,呼某和同事段某受公司委派前往内蒙古呼和浩特市出差。第二天晚上10点左右,两人前往当地一家会所准备进行精油推经络按摩。在三楼大厅等候区等待时,呼某突然发病,尽管经过抢救,最终仍不幸去世。事件发生后,呼某所在企业的人社部门作出不予认定工伤的决定...
09:18
微新创想:立夏一过,荔枝、榴莲、西瓜、芒果这些高甜水果开始热销。水果是好东西,但吃不对,真会伤身体。最近专家专门给大家支了几招,有些知识点还真得记一记。 荔枝是很多人喜爱的水果,但很多人只知道“一颗荔枝三把火”,却忽略了另一个潜在的风险,叫做“荔枝病”。这种病症主要发生在空腹吃荔枝的情况下,因为果糖转化成葡萄糖的速度赶不上胰岛素分泌的速度,导致血糖突然下降,...
09:18
微新创想:近日全球市场占有率最高的浏览器 Google Chrome 被爆出在用户不知情的情况下向符合条件的设备静默推送并下载了容量高达4GB 的 Gemini Nano 模型。这一行为引发了广泛的技术讨论和用户不满。用户发现,即便手动删除了相关文件,浏览器仍会在后台自动重新下载,这种“强制入驻”的方式让用户感到困扰。 Gemini Nano 是谷歌专门为本...
09:18
微新创想:在 OpenAI 与埃隆·马斯克旷日持久的法律纠纷中,OpenAI 总裁格雷格·布罗克曼的个人私密日记意外成为了法庭辩论的核心。近日,布罗克曼在庭审现场被迫公开宣读其多年来的日记摘要。这些文字被马斯克方的法律团队视为关键证据,试图证明 OpenAI 的高层早已背离了最初的“非营利”使命,转而追求巨额个人财富。 布罗克曼在庭审中表现得十分痛苦,他强调...