字节豆包1.8包圆互联网 AI助手全面入侵多平台

豆包手机问世仅半月,字节跳动便迅速推出通用agent模型豆包1.8,标志着AI技术迈入现实应用新阶段。这款多模态大模型不仅能操作手机、电脑和浏览器,还能像人类一样理解屏幕界面,通过点击滑动完成复杂任务。字节此次大胆创新,将豆包的领地从手机端迅速扩展至PC端,未来更计划覆盖智能硬件和智能座舱,实现互联网入口的全面掌控。此前豆包手机已让字节成为移动互联网的焦点,微信、淘宝等超级APP明确拒绝其调用。如今豆包1.8的问世,无疑将这场竞争推向更高维度。

字节豆包1.8包圆互联网 AI助手全面入侵多平台插图1

豆包1.8的多模态理解能力令人瞩目。模型能同时处理图像和视频内容,单次视频理解帧数从640帧提升至1280帧,可低帧率把握长视频整体脉络,在关键片段自动切换高帧率分析。官方演示中,豆包1.8通过分析篮球视频,精准提炼比赛核心内容。在ZeroBench评测中,其11.0分的成绩超越Gemini-3-Pro的10.0分,位居业界首位。ZeroBench作为极限视觉推理基准的核心测试,分数越高代表模型越能理解复杂视频。视觉推理任务中,豆包1.8在MathVista、MathVision和LogicVista测试中分别取得87.7、81.3和78.3分,虽略逊于Gemini-3-Pro,但已稳居第一梯队。视频理解方面,VideoHolmes、EgoTempo和MotionBench测试得分分别为65.5、67.0和70.6,长视频和流式视频处理能力同样出色。

豆包1.8的agent能力尤为突出。模型可执行代码、操作图形界面、调用各类工具,通过统一的agentic接口完成多步骤复杂任务。在BrowserComp-en搜索任务基准测试中,其67.6分的成绩表现稳定。字节技术报告显示,模型支持search、code execution、GUI interaction三种核心交互方式。基础能力测试中,豆包1.8在AIME-25、BeyondAIME、AMO-Bench和LiveCodeBench测试中分别获得94.3、77.0、60.0和79.5分,证明其底层能力扎实。字节还构建了覆盖教育、客服问答、复杂工作流等高价值场景的内部评测基准,豆包1.8在教育和客服问答测试中均取得最高分,验证了其实际业务表现。

字节豆包1.8包圆互联网 AI助手全面入侵多平台插图2

豆包1.8提供四种thinking模式:no_think、think-low、think-medium、think-high,通过平衡延迟、计算成本和解决方案质量,满足不同任务需求。用户可根据任务复杂度选择模式,低算力模式适用于快速响应场景,高算力模式处理复杂任务。视觉编码优化显著降低了图像视频输入的token消耗。长上下文处理支持256K上下文长度,并配备原生API级上下文管理,体现了字节对实际应用场景的深度规划。

豆包1.8的能力范围远超手机助手,浏览器和PC端均可使用。字节正试图用AI技术覆盖整个互联网生态。近年来浏览器市场AI化趋势明显,Chrome、Edge等传统浏览器纷纷加入AI功能,Atlas、Disco等AI浏览器相继问世。Market.us数据显示,2024年全球AI浏览器市场规模约45亿美元,预计2034年将达768亿美元,年复合增长率达32.8%。豆包1.8的云端架构实现跨设备协同,用户可在手机下达指令,由电脑浏览器执行。例如浏览抖音时发现感兴趣内容,可让电脑浏览器自动打开手机视频,这种跨平台能力是传统浏览器AI化难以企及的。

字节豆包1.8包圆互联网 AI助手全面入侵多平台插图3

字节此举暗合微软Windows成为”AI agent操作系统”的构想,但二者实现路径不同。微软需从底层改造系统架构,而豆包1.8作为外部代行者,更像是简化用户操作的外骨骼。为达成目标,豆包1.8在文字图表理解领域进行专项优化,能阅读复杂学术图表、数据可视化和技术文档示意图,在处理公式图表为主的学术论文时,可精准提取关键信息、理解图表含义并建立文字与图示的对应关系。针对PC端任务复杂性,模型加入并行思考机制,通过分配额外计算资源同时探索多个解决方案路径,最终选择最优解。旅行规划场景测试显示,豆包能综合处理地图、图片、文字描述等多模态信息,生成兼顾预算、时间、偏好的详细行程安排。

字节试图扩大AI蛋糕,但豆包手机引发的争议使其成为众矢之的。互联网商业逻辑显示,用户停留时间越长,广告收益越高。应用开发商通过优化界面和转化路径提升用户黏性,掌握应用即掌握用户。agent模型却颠覆这一逻辑——豆包1.8可调用十余个工具完成电商平台的全网比价和下单,用户无需打开淘宝等应用,只需告知需求,agent便会自动完成搜索比价筛选下单,全程无需接触应用界面,自然也看不到任何广告。实测中豆包1.8通过playwright MCP工具,可按指令筛选淘宝500-1000元销量第一的蓝牙耳机,再到唯品会、京东比价并完成加购。对用户是效率提升,对应用开发商则是巨大威胁。

字节豆包1.8包圆互联网 AI助手全面入侵多平台插图4

更深远的影响在于用户认知转变。过去”购物用淘宝、打车用滴滴”的固定模式,将变为”向agent说明需求,由其选择服务”。应用从流量关口沦为agent可选工具,互联网统治权将从应用层转向模型层。豆包手机遭遇的封禁本质是应用开发商的防御反应,但能否持续取决于用户选择。若agent体验显著优于传统应用操作,APP开发商将被迫调整策略——或开放API接口,或保留部分广告展示,或转向服务收费。AI agent竞争日益激烈,智谱12月9日宣布开源核心AI agent模型AutoGLM,其能力与豆包手机助手相似,已支持微信、淘宝等50余个高频中文应用。AutoGLM-Phone-9B仅需36GB空间即可在手机本地运行,采用MIT和Apache-2.0双许可证,任何人可免费用于商业用途。

移动互联网时代谷歌凭借开源Android建立庞大生态,智谱显然想复制这一路径。从技术实现看,豆包与AutoGLM的核心壁垒与大模型相同,腾讯、阿里等互联网大厂都掌握门票。但行业竞争的关键在于能否让agent与现有APP生态共存。字节既拥有模型能力,也拥有抖音、今日头条等流量大户,可先在自身应用中测试agent能力再向外扩展。云端架构使字节能快速迭代,豆包手机上线半月即推出多次更新,这种速度是传统硬件厂商难以企及的。豆包1.8是字节探索性尝试的证明,展示了AI改变互联网的可能性,但距离成熟产品仍有距离。最终能走多远,取决于字节在技术、生态、商业模式上能否实现更多突破。

字节豆包1.8包圆互联网 AI助手全面入侵多平台插图5

最新快讯

2025年12月22日

14:41
2025年12月22日,全球生物制药巨头Biogen(渤健)正式宣布达成一项重大战略交易,将以48亿美元收购专注于罕见代谢疾病药物研发的创新型生物技术公司Amicus Therapeutics。这一备受瞩目的收购案旨在深度整合双方在罕见病治疗领域的研发资源与产品管线,通过协同效应加速创新疗法的开发进程。Amicus Therapeutics作为罕见病治疗领域...
14:41
2025年12月22日,国际知名投资银行杰富瑞发布最新研报,正式上调对零售巨头沃尔玛的目标股价。在此次调整中,杰富瑞将沃尔玛的目標价从125美元大幅提升至132美元,这一举措充分体现了分析师团队对该公司未来业绩增长的强烈信心。据研报详细披露,此次目标价上调主要基于对沃尔玛零售与电商业务增长潜力的最新评估结果,特别是对其数字化转型战略和供应链优化措施成效的积极...
14:41
2025年12月22日,福建省泉州市正式发布《现代体育产品先进制造业集群培育提升三年行动方案(2025—2027年)》,旨在通过系统性布局推动体育制造业向高端化、智能化、多元化转型。该方案以构建现代体育产业链为核心,提出实施扩能提质专项行动,重点打造运动装备全场景生态圈。方案明确鼓励企业加大个性化定制、智能化研发投入,特别是在智能可穿戴设备、功能性鞋服、康复...
14:41
2025年12月20日,谷粒GuliKit宣布联合华硕ROG推出专为ROG Xbox Ally (X)掌机设计的TMR电磁摇杆模组。该模组相较原装碳膜摇杆,具备更高耐用性、精度与抗漂移能力,严格遵循原厂尺寸打造,支持系统内直接校准,无需额外工具。产品已获ROG官方认证,确保兼容性与稳定性。目前美国区售价为19.99美元(约合140.9元人民币)。
14:41
2025年12月22日,谷歌Chrome Canary浏览器版本迎来重大更新,新标签页设计已趋于稳定,AI功能的用户体验得到显著提升。在桌面端,搜索框旁边的“+”菜单新增了多项实用功能,用户可以直接添加图片、文件,或是启动深度搜索,让信息获取更加便捷高效。AI模式在此次更新中实现了上下文感知能力,能够智能总结用户上一浏览页面的核心内容,为后续的AI交互提供更...
14:41
2025年12月22日,smart品牌正式发布了旗下全新中型轿车精灵#6 EHD的详细续航表现,为消费者带来更具期待感的电动出行选择。这款备受瞩目的车型将提供两种纯电续航版本:基础版车型搭载20kWh电池组,纯电续航里程达到110公里;高配版车型则配备41.46kWh大容量电池组,纯电续航里程提升至234公里,满足不同场景下的出行需求。值得注意的是,精灵#6...
14:41
2025年12月22日,MetaMetrics与Blue Heron Global宣布建立战略合作伙伴关系,旨在扩大Lexile阅读水平测评在中国的应用。根据协议,Blue Heron将成为Lexile测评在中国的授权经销商,推动其在教育科技与出版领域的规模化采用。目前,Blue Heron已与中国多家知名教育机构签约,包括阳光学习中心、阿里优课、健金教育...
14:41
2025年12月22日,备受瞩目的AI硬件企业分音塔科技正式宣布成功斩获近亿元人民币A轮融资。此次投资由实力雄厚的合鼎共投资(广州)有限公司与衢州智造安合股权投资合伙企业联合领投,彰显了资本市场对该企业创新实力的高度认可。 作为国内领先的AI声学技术开发商,分音塔科技长期致力于声纹识别、语音识别及机器翻译等前沿技术的研发突破。其核心产品矩阵已广泛应用于AI+...
14:41
2025年12月22日,兆威机电正式宣布启动境外上市计划,公司已正式申请在香港联合交易所主板挂牌H股。这一重要战略举措旨在进一步拓宽国际融资渠道,为公司的全球化发展注入强劲动力。据悉,兆威机电正积极推进各项上市准备工作,确保整个流程高效有序。此次香港上市不仅将提升公司在国际资本市场的知名度,还将为公司带来更多元化的资金支持,助力其在全球市场拓展业务版图。随着...
14:41
12月22日,备受瞩目的夸克AI眼镜正式开启G1与S1系列两款新品的预售活动,为消费者带来全新的智能体验。G1风尚眉框款以极具吸引力的1999元起售价,大幅降低了用户体验前沿科技的门槛,让更多人能够轻松拥抱AI带来的便利。与此同时,S1旗舰系列新增了一款圆框玳瑁配色,不仅丰富了产品线,更满足了不同用户的个性化审美需求。 此次发布的两款新品均搭载了强大的千问A...
14:41
2025年12月22日,备受瞩目的高性能GPU研发企业壁仞科技正式宣布,在本次招股期间成功斩获3.73亿美元巨额基石轮投资,引发业界广泛关注。作为国内智能计算领域的领军者,壁仞科技始终专注于高性能通用GPU的研发创新,致力于构建完全自主原创的软硬件技术体系,为推动国产智能计算产业生态的蓬勃发展注入强劲动力。此次融资吸引了3W Fund、启明创投、AMF等多家...
14:40
在“左滑右滑”主导十年后,新一代约会App正用语音对话打破浅层匹配的困局。由斯坦福辍学生Celeste Amadon与Asher Allen创立的旧金山初创公司Known,凭借一套AI语音引导的深度对话式匹配系统,实现80%的初次介绍转化为线下约会——远超传统交友软件不足10%的见面率。近日,该公司宣布完成970万美元融资,由Forerunner(首次投资约...