Mini-o3开源模型突破传统实现超长视觉推理深度思考

Mini-o3开源模型突破传统实现超长视觉推理深度思考插图1

字节跳动与香港大学强强联手,共同研发出突破性的开源视觉推理模型——Mini-o3,为多轮视觉推理技术领域带来革命性进展。与以往仅支持1-2轮对话的视觉语言模型(VLM)相比,Mini-o3在训练阶段设定了6轮对话限制,却在测试环节实现了数十轮的推理扩展,显著增强了处理复杂视觉问题的能力。该模型在高难度视觉搜索任务中的深度推理表现,已达到当前技术前沿水平,其卓越性能源于三大核心设计要素的精妙融合。

Mini-o3开源模型突破传统实现超长视觉推理深度思考插图2

首先,研究团队精心构建了VisualProbe视觉探测数据集,内含数千个专为探索性推理设计的视觉搜索难题,为模型提供了丰富的认知训练素材。其次,他们创新性地开发了迭代数据收集流程,使模型能够自主学习深度优先搜索、试错探索和目标维持等多元推理策略,大幅提升了认知灵活性。最后,团队提出的超轮次掩码策略在强化学习过程中巧妙规避了对达到最大交互轮次的回答进行惩罚,这一创新显著提高了训练效率与测试扩展性。

Mini-o3开源模型突破传统实现超长视觉推理深度思考插图3

Mini-o3的训练过程采用双阶段设计,第一阶段通过冷启动监督微调(SFT)激活多轮工具使用能力,研究团队通过上下文学习方式积累了大量高质量推理轨迹。第二阶段引入强化学习(RL)机制,通过降低图像像素限制和引入超轮次掩码技术,使模型互动轮次和推理能力得到质的飞跃。在多个视觉搜索基准测试中,Mini-o3的表现全面超越现有开源模型,展现出强大的技术优势。

对比实验进一步证实,冷启动SFT技术和超轮次掩码机制是提升推理能力的两大关键支柱。此外,合理的最大像素预算设置对模型性能优化同样至关重要。Mini-o3的问世不仅在技术上树立了新标杆,更为未来多轮视觉推理发展指明了创新方向。这一突破性成果表明,无需依赖海量训练资源,深度思考和复杂推理已成为可能,为人工智能领域注入了新的活力。论文详情请参阅:https://arxiv.org/pdf/2509.07969

最新快讯

2025年09月16日

14:17
近日,英伟达携手多伦多大学、向量研究所及德克萨斯大学奥斯汀分校的研究团队,共同推出了一项名为 **ViPE(视频姿势引擎)** 的革命性技术。这项突破性成果致力于攻克3D几何感知领域的关键难题——如何从纷繁复杂的自然视频数据中高效且精准地提取三维信息。作为自动驾驶、虚拟现实(VR)和增强现实(AR)等前沿技术的核心支撑,3D几何感知的重要性不言而喻。ViPE...
14:17
2025年9月16日,国内足金饰品市场迎来一波显著的价格上涨浪潮。这一轮涨势主要受国际金价持续走高的直接推动,导致消费者在购买足金饰品时面临更高的成本压力。据市场监测数据显示,周生生足金饰品的报价已攀升至1091元/克,而周大福、六福珠宝、谢瑞麟以及老庙黄金等主流珠宝品牌的价格也紧随其后,普遍涨至1087元/克。这一价格调整反映了国际黄金市场供需关系的微妙变...
14:17
近日,一则关于平安人寿上海总部迁至深圳的消息在业界引发广泛关注。针对此传闻,平安人寿方面迅速作出官方回应,强调此举完全符合《保险法》《公司法》等相关法律法规的要求。根据规定,保险公司的主要办公场所必须与其注册住所保持一致,这是行业监管的基本要求。 平安人寿表示,此次调整主要是为了进一步优化公司内部管理架构,通过集中办公模式提升整体运营效率。公司将对总部办公地...
14:16
2025年9月16日,全球激光雷达领域的领军企业禾赛科技正式在香港交易所主板成功挂牌上市,这一里程碑事件使其成为业内首家同时实现“美股+港股”双重主要上市平台的激光雷达企业。此次首次公开募股(IPO)不仅刷新了全球激光雷达行业的融资纪录,其高达41.6亿港元的融资总额更是创下近四年来中概股回港上市的最大规模。作为自动驾驶和智能感知技术的核心供应商,禾赛科技的...
14:16
香港旅游发展局最新发布的数据显示,8月份香港迎来旅游复苏的强劲势头。初步统计的访港旅客人数高达515万人次,较去年同期实现16%的显著增长,不仅刷新了疫情后单月的游客纪录,更彰显了香港作为国际旅游中心的蓬勃活力。 值得关注的是,今年前八个月累计访港旅客总量已突破3300万人次,同比增长12%,呈现持续稳定的增长态势。在旅客来源结构方面,内地访客贡献了绝大部分...
14:16
近日,抖音副总裁李亮就社交媒体平台上泛滥的“字节离职员工”相关帖子发表回应。他指出,这些帖子往往以“月薪X万离开字节”作为吸睛标题,并配上公司LOGO背景墙或工卡照片,以此吸引大量流量关注,逐渐演变成一种颇具争议的“字节离职赛道”现象。李亮并未直接评判此类内容的真实性,但坦言其已成为当下社交媒体传播领域的一种显著趋势。这种现象不仅引发了公众对字节跳动薪酬待遇...
14:16
2025年9月16日,在一场备受瞩目的公开互动中,埃隆·马斯克正式确认了其雄心勃勃的纯AI软件公司项目——Macrohard的推进计划。这一消息不仅引发了科技界的广泛关注,更透露出马斯克在人工智能领域的最新布局。据马斯克本人透露,项目团队正在孟菲斯建造的巨像II超级计算集群屋顶上,大规模喷绘"MACROHARD"字样,其设计之宏伟,甚至可以从太空中清晰观测到...
14:16
2025年9月16日,汇丰银行正式宣布重新覆盖阿里巴巴股票,并给予强劲的买入评级,同时将目标价设定在160美元。这一重要市场动作不仅彰显了汇丰对阿里巴巴未来发展的坚定信心,更体现了其对该企业长期增长潜力的深度认可。 汇丰银行此次重新覆盖阿里巴巴股票,是基于对公司基本面和行业前景的综合评估。分析师团队在报告中指出,阿里巴巴在数字经济领域的持续创新和业务拓展,为...
14:16
苹果公司正式宣布,其位于东京银座3丁目的首家日本直营店即将迎来全面重启。这家备受瞩目的零售空间自2003年落成以来,凭借其标志性的五层楼多功能设计,一度成为银座地区的标志性商业地标。然而由于原建筑拆除,该门店于2022年暂时迁至银座8丁目继续运营。 新店外观设计迎来重大革新,采用全玻璃结构打造出更加通透现代的建筑形象,充分展现苹果对建筑美学的持续追求。虽然内...
14:16
2025年9月16日,深圳腾讯全球数字生态大会现场掀起科技浪潮。腾讯正式宣布全面开放AI能力,并发布腾讯云智能体战略全景图,标志着其AI技术进入全面赋能企业创新的新阶段。通过推出智能体解决方案、SaaS+AI一体化服务以及前沿大模型技术三大核心升级,腾讯云为企业提供全方位的智能化转型支持,助力各行业提升创新效率与核心竞争力。 值得关注的是,腾讯旗下AI应...
14:16
2025年9月16日,生态环境部隆重召开纪念《保护臭氧层维也纳公约》缔结40周年暨国际保护臭氧层日纪念大会,旨在回顾全球臭氧层保护历程,展望未来可持续发展新篇章。生态环境部副部长于会文在会上发表重要讲话,强调中国在淘汰消耗臭氧层物质方面取得的显著成就。他指出,截至目前,中国已累计淘汰约62.8万吨消耗臭氧层物质,这一数字不仅占发展中国家淘汰总量的50%以上,...
14:16
2025年9月16日,北京时间,时尚巨头遭遇重大数据泄露事件,引发全球关注。古驰、巴黎世家以及亚历山大·麦昆等奢侈品牌数百万客户的敏感信息被网络犯罪分子成功窃取,引发新一轮数据安全恐慌。 此次被盗信息范围广泛,涵盖客户姓名、联系方式、详细地址以及完整的消费记录等关键隐私数据。值得注意的是,这些奢侈品牌的部分客户属于高净值人群,其消费记录可能包含高价值商品交易...