Mini-o3开源模型突破传统实现超长视觉推理深度思考

Mini-o3开源模型突破传统实现超长视觉推理深度思考插图1

字节跳动与香港大学强强联手,共同研发出突破性的开源视觉推理模型——Mini-o3,为多轮视觉推理技术领域带来革命性进展。与以往仅支持1-2轮对话的视觉语言模型(VLM)相比,Mini-o3在训练阶段设定了6轮对话限制,却在测试环节实现了数十轮的推理扩展,显著增强了处理复杂视觉问题的能力。该模型在高难度视觉搜索任务中的深度推理表现,已达到当前技术前沿水平,其卓越性能源于三大核心设计要素的精妙融合。

Mini-o3开源模型突破传统实现超长视觉推理深度思考插图2

首先,研究团队精心构建了VisualProbe视觉探测数据集,内含数千个专为探索性推理设计的视觉搜索难题,为模型提供了丰富的认知训练素材。其次,他们创新性地开发了迭代数据收集流程,使模型能够自主学习深度优先搜索、试错探索和目标维持等多元推理策略,大幅提升了认知灵活性。最后,团队提出的超轮次掩码策略在强化学习过程中巧妙规避了对达到最大交互轮次的回答进行惩罚,这一创新显著提高了训练效率与测试扩展性。

Mini-o3开源模型突破传统实现超长视觉推理深度思考插图3

Mini-o3的训练过程采用双阶段设计,第一阶段通过冷启动监督微调(SFT)激活多轮工具使用能力,研究团队通过上下文学习方式积累了大量高质量推理轨迹。第二阶段引入强化学习(RL)机制,通过降低图像像素限制和引入超轮次掩码技术,使模型互动轮次和推理能力得到质的飞跃。在多个视觉搜索基准测试中,Mini-o3的表现全面超越现有开源模型,展现出强大的技术优势。

对比实验进一步证实,冷启动SFT技术和超轮次掩码机制是提升推理能力的两大关键支柱。此外,合理的最大像素预算设置对模型性能优化同样至关重要。Mini-o3的问世不仅在技术上树立了新标杆,更为未来多轮视觉推理发展指明了创新方向。这一突破性成果表明,无需依赖海量训练资源,深度思考和复杂推理已成为可能,为人工智能领域注入了新的活力。论文详情请参阅:https://arxiv.org/pdf/2509.07969

最新快讯

2025年11月28日

20:02
2025年11月28日,长安汽车正式宣布了一项具有里程碑意义的战略布局——拟以自有资金2.25亿元参与设立全新机器人公司。这一举措标志着长安汽车在智能化转型道路上迈出了坚实一步,也彰显了其向多元化科技巨头迈进的决心。据悉,新成立的长安机器人公司将由中国长安、辰致科技和长安科技共同出资组建,注册资本高达4.5亿元,其中长安汽车以50%的持股比例成为控股股东,凸...
20:02
2025年11月28日,社交巨头Meta旗下的Instagram平台重磅推出两项创新功能——本地化语音翻译与字体适配,旨在为全球创作者提供更强大的跨语言传播工具。这一系列优化举措将显著提升内容在多语言环境下的可理解性与视觉吸引力,帮助创作者突破地域限制,更精准地触达不同语言背景的用户群体。 通过先进的语音识别与机器翻译技术,Instagram能够实时将语...
20:02
2025年11月28日,安世中国正式发布了一份措辞强硬的声明,直指安世荷兰在控制权问题上的不当行为,并要求其立即与相关方展开真诚磋商。声明明确指出,当前全球半导体供应链的混乱局面,主要源于荷兰方面的一系列违规操作,其海外扩产计划不仅扰乱了正常的市场秩序,更试图通过替代中国产能来谋求不正当优势。安世中国强烈谴责荷方这种破坏全球产业分工的行为,要求其立即停止在马...
20:02
2025年11月28日,中国巨石发布重要公告,宣布其控股股东振石集团正式启动股份增持计划。据悉,振石集团目前持有公司总股本的16.88%,此次计划将通过自有资金及专项贷款,筹集5.5亿元至11亿元的资金,分阶段逐步增持公司股份。这一举措不仅彰显了振石集团对巨石未来发展的坚定信心,更体现了其对公司长期价值的深度认可。根据公告内容,增持的具体实施将灵活调整,择机...
20:02
2025年11月28日,备受瞩目的2025数据要素发展大会在北京隆重召开。在此次盛会期间,中国信息通信研究院正式发布了《数据要素发展报告(2025年)》,为我国数据要素市场的发展提供了权威解读。报告深入分析了当前数据要素领域面临的挑战与机遇,指出数据基础制度与现有体系的衔接仍存在明显短板,技术产业规模化突破尚未实现。为有效激发数据要素的内在活力,报告提出了一...
19:01
2025年11月28日,胜科纳米正式宣布一项重大战略布局,其全资子公司青岛胜科计划投入约5亿元人民币,全力推进“青岛检测分析能力提升建设项目”。这一举措标志着胜科纳米在半导体检测与分析领域的深度拓展,旨在通过技术升级和产能扩张,进一步巩固其在第三方检测服务市场的领先地位。 该项目投资主体为青岛胜科或其关联企业,建设地点选址于青岛这一重要的科技创新中心。据...
19:01
2025年11月28日,中国创新药企贝达药业传来振奋人心的消息,其自主研发的盐酸恩沙替尼胶囊上市许可申请已成功获得欧洲药品管理局(EMA)的正式受理。这款备受瞩目的靶向药物,专为治疗间变性淋巴瘤激酶(ALK)阳性的非小细胞肺癌患者设计,此次获得EMA受理标志着其进军欧洲市场的关键一步,有望为欧洲患者带来全新的治疗希望。 该药物的申请材料基于一项全球多中心II...
19:01
2026年初,备受期待的M&M'S全新门店即将在上海迪士尼度假区迪士尼小镇盛大启幕。这家标志性门店坐落于迪士尼小镇入口附近黄金位置,将为游客提供集购物、餐饮与娱乐体验于一体的全方位休闲空间。玛氏中国官方宣布,此次新店开业将是品牌在中国市场战略布局的重要里程碑。据悉,新门店将精心打造沉浸式品牌体验空间,通过创新设计、互动装置和特色活动,让消费者深度感受...
19:01
2025年第三季度,美团核心本地商业分部遭遇了前所未有的经营困境,实现经营亏损高达141亿元人民币,较去年同期由盈转亏的局面形成鲜明对比。回顾去年同期,该分部曾实现经营溢利146亿元,经营利润率维持在令人羡慕的21.0%水平。然而,本季度这一数据急转直下,不仅扭亏为盈,反而跌至-20.9%的亏损区间,利润率大幅下滑41个百分点。 造成这一结果的主要原因是多方...
19:01
2025年11月28日,中国生物科技企业海特生物迎来重大突破,其参股公司研发的创新眼用注射液ZM-02正式获得美国食品药品监督管理局(FDA)的临床试验批准。这一里程碑事件不仅彰显了ZM-02的卓越研发潜力,更标志着该产品迈向国际化的关键一步。据悉,ZM-02将在美国境内开展严谨的临床试验,全面评估其在治疗各类眼部疾病方面的安全性与有效性。作为该项目的参股方...
19:01
2025年11月28日,医药企业泰恩康迎来重大突破,其全资子公司正式获得国家药品监督管理局颁发的巴瑞替尼片药品注册证书。这一里程碑事件不仅意味着该创新药物即将进入临床应用阶段,更标志着泰恩康在自身免疫疾病治疗领域迈出了关键一步。据悉,巴瑞替尼片作为一款口服JAK抑制剂,凭借其强大的抗炎特性,被批准用于治疗中重度斑秃及类风湿关节炎两大高发性自身免疫疾病。此次成...
19:01
首旅如家近日宣布与云迹科技达成战略合作,在上海等一线城市的多家门店成功引入煮面机器人,正式开启餐饮智能化升级新篇章。此次合作的核心目标在于全面升级旗下特色服务「如家这碗面」,通过引入自动化煮面机器人,显著提升早餐服务的餐饮效率与标准化水平,为消费者带来更稳定、更高效的用餐体验。 据悉,这款煮面机器人能够全流程自动化完成从取面、煮面到加汤等关键步骤,其卓越性能...