DeepEyesV2智能工具突破:多模态AI超越更大模型

中国科研团队近日发布了一款创新性多模态人工智能模型——DeepEyesV2,该模型具备分析图像、执行代码及进行网络搜索的强大能力。与依赖训练数据积累的传统模型不同,DeepEyesV2通过智能调用外部工具实现卓越表现,在多项任务中甚至超越了规模更大的竞争对手。

在早期实验中,研究团队发现单纯依靠强化学习难以稳定运用工具完成多模态任务。模型初期尝试为图像分析编写Python代码,却频繁生成错误片段,更在训练后期完全放弃工具调用。为攻克这一难题,团队创新性地采用两阶段训练机制:第一阶段着重培养模型融合图像理解与工具使用的协同能力,第二阶段则通过强化学习持续优化这些行为。通过引入顶尖模型生成的优质示例,研究人员确保了工具调用路径的精准性与清晰度。

DeepEyesV2智能工具突破:多模态AI超越更大模型插图1

DeepEyesV2采用三大核心工具类别应对多模态挑战:代码执行工具专攻图像处理与数值分析,图像搜索工具用于检索相似内容,文本搜索工具则提供图像隐含的上下文信息。通过整合图像操作、Python代码执行及跨模态搜索功能,模型能够灵活适应各类查询需求。

为科学评估这一创新方法,研究团队构建了RealX-Bench基准测试体系,全面检验模型在视觉理解、网络搜索和推理能力上的综合表现。测试显示,即便是业界顶尖的专有模型准确率也仅达46%,而人类表现则高达70%。在需要同时运用三种技能的复杂任务中,现有模型的性能更显得力不从心。

令人瞩目的是,DeepEyesV2在多项基准测试中取得突破性成果:数学推理任务准确率达52.7%,搜索驱动任务准确率更高达63.7%。这一成就有力证明,通过精心设计的工具运用策略,即便是规模较小的模型也能显著提升性能表现。目前,DeepEyesV2已通过Hugging Face和GitHub平台公开发布,采用Apache License 2.0授权,为商业应用提供开放支持,必将进一步推动多模态人工智能技术的创新发展。

DeepEyesV2智能工具突破:多模态AI超越更大模型插图2

🌟 DeepEyesV2通过智能工具调用显著提升多模态任务表现,在多项测试中超越大型模型

🔧 采用创新的两阶段训练流程,成功融合图像理解与工具使用能力

📈 多项基准测试成果优异,充分展现小型模型的巨大潜力

最新快讯

2025年11月17日

12:19
中环新能源近日正式宣布,与美国海明威家族基金会旗下盈智海明威增长收益基金达成全球战略合作伙伴关系,双方将携手共进,共同推动新能源产业的蓬勃发展。此次合作的核心内容之一是,盈智海明威增长收益基金或其关联企业将战略投资中环新能源,认购其不超过20%的股权,成为该企业长期稳定的产业投资方。这一举措不仅彰显了中环新能源对未来市场前景的坚定信心,也为其国际化战略布局注...
12:19
2025年11月17日,备受瞩目的欧洲最大中小企业峰会CoCreate在欧陆拉开帷幕。在这场汇聚全球商业精英的盛会中,阿里国际站重磅宣布将正式推出革命性AI Mode功能,为全球中小企业跨境电商采购开启智能化新篇章。该模式创新性地融合了前沿AI Agent技术,通过深度行业认知、自动化任务执行以及多模态供应链信息挖掘三大核心能力,将有效降低中小企业参与全球采...
12:19
金讯智能近日传来振奋人心的消息,成功斩获两山国控集团领投的A轮融资,这一里程碑事件将为其在智慧工厂领域的持续创新注入强劲动力。作为机器人RV减速器研发与FA设备制造的领军企业,金讯智能始终站在智能制造技术的前沿阵地,以打造高效自动化生产体系为己任,通过深度融合物联网解决方案,为制造业的智能化转型提供全方位的技术支撑。此次融资不仅彰显了资本市场对金讯智能技术实...
12:19
华控智加近日成功斩获B+轮战略融资,由知名投资机构黄海汇创领投。这家创新型企业以颠覆性的技术融合为核心竞争力,将低资源非协作AI技术与知识图谱深度结合,开创性地应用于工业设备健康状态建模分析领域。通过构建以机器声纹为核心的多维数据融合解决方案,华控智加实现了对设备运行状态的实时智能监测与精准预测性维护,为工业客户的设备管理提供了革命性的解决方案。 该技术已在...
12:19
快牛QuickCEP跨境电商一站式SaaS平台近日成功完成A+轮融资,投资方为知名风险投资机构啟赋资本。此次融资不仅彰显了资本市场对快牛QuickCEP创新模式的认可,更将为其持续深耕跨境电商领域注入强劲动力。 作为国内领先的跨境电商SaaS服务商,快牛QuickCEP基于自主研发的CEP平台,为中国跨境独立站企业提供全方位的海外营销解决方案。其核心产品覆盖...
12:19
近日,专注于叠层太阳能电池研发的黑晶光电成功完成B轮融资,投资方为实力雄厚的中山火炬电子产业基金和中山金控投资。作为新能源领域的创新先锋,黑晶光电始终致力于新型太阳能电池技术的开发与制造,通过不断突破技术壁垒,推动清洁能源产业的持续进步。其产品线丰富多元,涵盖钙钛矿及晶硅叠层、钙钛矿及钙钛矿叠层,以及半透明钙钛矿组件等系列,这些创新产品不仅显著提升了太阳能利...
12:19
和淳医疗,一家深耕慢性病管理领域的医疗器械创新企业,近日成功宣布完成B轮融资,本轮融资由知名投资机构礼来亚洲基金与启明创投联合领投。作为国内领先的三类医疗器械及可穿戴智能设备研发商,和淳医疗始终致力于为慢性病患者提供全方位的长期健康管理解决方案,通过先进的智能化技术手段显著提升疾病监测与干预效率,改善患者生活质量。 此次融资不仅为和淳医疗注入了强劲的发展动力...
12:19
第十九届迪拜航展盛大启幕,"中国力量"以震撼姿态成为全场焦点。翼龙-X无人机首次在境外航展以1:1比例进行静态展示,其先进的空中侦察与打击能力引发现场观众热烈讨论,成为展会的一大亮点。这一创新展示不仅彰显了中国航空科技的最新成果,更向世界展示了我国无人机技术的领先地位。 在航空发动机领域,中国航发携19款明星产品震撼亮相,创下国产航空发动机海外展出史上的两项...
12:19
2025年11月14日,深圳市恒运昌真空技术股份有限公司正式向科创板提交IPO注册申请,计划募集资金高达14.69亿元,由中信证券担任保荐机构。作为半导体设备核心零部件的领军企业,恒运昌专注于等离子体射频电源系统的研发与生产,其产品性能卓越,能够满足7-14纳米先进制程的需求,已成功应用于包括拓荆科技、中微公司、北方华创在内的多家行业头部企业,市场认可度极高...
12:19
近日,定制旅行服务平台小云智能成功斩获数千万元天使轮融资,知名旅行品牌皇包车旅行创始人孟磊亲自领投。这一创新平台由皇包车旗下云地接业务前负责人杨凯倾力打造,旨在构建一个集SaaS工具与资源采购功能于一体的综合性同业定制游服务平台。 小云智能以先进的AI行程规划工具为核心,彻底颠覆传统手工作业模式,大幅提升定制旅行效率。平台允许定制师在线便捷筛选真实目的地向导...
12:19
甄象科技,这家成立于2025年的创新企业,正以卓越的云计算技术引领数字化转型浪潮。公司旗下核心产品包括CloudCare云服务平台和DataFlux可观测平台,为企业提供全方位的智能化解决方案,助力其在数字化时代实现高效运营与业务突破。近日,甄象科技传来振奋人心的消息,成功完成新一轮战略融资,投资方阵容星光熠熠,包括阿里云、红杉中国等业内顶尖机构。这一里程碑...
12:19
近日,国内高端晶圆级光学玻璃(WLG)制造领域的领军企业多谱芯光成功完成A轮融资,本轮投资由国发创投、深创投及中科创星联合领投。作为一家专注于晶圆级光学玻璃元件及模组研发的前沿技术公司,多谱芯光凭借其创新技术实力,正致力于推动光学玻璃在晶圆级尺度的量产工艺实现重大突破。此次融资不仅为企业注入了强劲的资金支持,更将助力其加速光学镜头等核心产品的产业化进程,进一...