DeepEyesV2智能工具突破:多模态AI超越更大模型

中国科研团队近日发布了一款创新性多模态人工智能模型——DeepEyesV2,该模型具备分析图像、执行代码及进行网络搜索的强大能力。与依赖训练数据积累的传统模型不同,DeepEyesV2通过智能调用外部工具实现卓越表现,在多项任务中甚至超越了规模更大的竞争对手。

在早期实验中,研究团队发现单纯依靠强化学习难以稳定运用工具完成多模态任务。模型初期尝试为图像分析编写Python代码,却频繁生成错误片段,更在训练后期完全放弃工具调用。为攻克这一难题,团队创新性地采用两阶段训练机制:第一阶段着重培养模型融合图像理解与工具使用的协同能力,第二阶段则通过强化学习持续优化这些行为。通过引入顶尖模型生成的优质示例,研究人员确保了工具调用路径的精准性与清晰度。

DeepEyesV2智能工具突破:多模态AI超越更大模型插图1

DeepEyesV2采用三大核心工具类别应对多模态挑战:代码执行工具专攻图像处理与数值分析,图像搜索工具用于检索相似内容,文本搜索工具则提供图像隐含的上下文信息。通过整合图像操作、Python代码执行及跨模态搜索功能,模型能够灵活适应各类查询需求。

为科学评估这一创新方法,研究团队构建了RealX-Bench基准测试体系,全面检验模型在视觉理解、网络搜索和推理能力上的综合表现。测试显示,即便是业界顶尖的专有模型准确率也仅达46%,而人类表现则高达70%。在需要同时运用三种技能的复杂任务中,现有模型的性能更显得力不从心。

令人瞩目的是,DeepEyesV2在多项基准测试中取得突破性成果:数学推理任务准确率达52.7%,搜索驱动任务准确率更高达63.7%。这一成就有力证明,通过精心设计的工具运用策略,即便是规模较小的模型也能显著提升性能表现。目前,DeepEyesV2已通过Hugging Face和GitHub平台公开发布,采用Apache License 2.0授权,为商业应用提供开放支持,必将进一步推动多模态人工智能技术的创新发展。

DeepEyesV2智能工具突破:多模态AI超越更大模型插图2

🌟 DeepEyesV2通过智能工具调用显著提升多模态任务表现,在多项测试中超越大型模型

🔧 采用创新的两阶段训练流程,成功融合图像理解与工具使用能力

📈 多项基准测试成果优异,充分展现小型模型的巨大潜力

最新快讯

2025年11月17日

15:05
华为将于11月25日14:30举行全场景新品发布会,推出Mate 80系列、Mate X7等多款新品。其中,Mate 80 RS非凡大师等新机已于11月17日12:08开启预订。此次发布将涵盖旗舰手机及全场景智能设备,进一步拓展华为在高端市场的布局。
15:05
美国国家飓风中心(NHC)预报员菲利普·帕潘凭借谷歌DeepMind人工智能模型,成功预判热带风暴“梅丽莎”将在24小时内跃升为四级飓风并直击牙买加。这是NHC历史上首次对风暴快速增强作出如此明确的提前预警。DeepMind作为全球首个专为飓风预报研发的AI系统,在本季13个热带风暴中路径预测表现最优,运算速度快、成本低,已在多个关键指标上超越传统数值模型...
15:05
2025年11月17日,阿里巴巴新推出的AI应用“通义千问”在公测首日因用户访问量激增,导致部分服务出现拥堵和中断。多地用户反映上线后无法正常使用,输入指令无响应,相关话题迅速登上微博热搜。阿里方面回应称:“我好着呢,状态良好,欢迎来问。”目前服务已逐步恢复。
15:05
2025年11月17日,上海长宁KING88商场内,盒马创始人侯毅推出的新品牌“派特鲜生”宠物零售店已暂停营业。该店开业仅数月,因客流量不足、经营压力大,未能维持线下运营。侯毅表示,计划于12月中旬前关闭全国所有“派特鲜生”线下门店,但将继续保留线上业务,探索更可持续的发展模式。此举反映出新消费品牌在实体零售扩张中面临的挑战。
15:05
2025年11月17日,迪拜航展正式开幕,中国商飞携两架C919客机和一架C909区域机型参展。此次是C919首次亮相中东主流航展,三日前飞机已抵达阿勒马克图姆国际机场并完成预展准备。展会吸引多家中东航空公司、租赁机构及媒体关注。商飞表示,此行旨在拓展中东市场,重点推介C919与C909(原ARJ21)两款机型,寻求潜在客户合作。
15:05
健春堂药房近日成功完成800万元天使轮融资,这笔资金将重点用于门店网络扩展、DTP药房服务体系优化及专业团队扩充。作为一家批零一体化的连锁药房品牌,健春堂聚焦肿瘤与特殊疾病领域,通过新特药销售、用药追踪和私人疾病管理等多元化服务,持续提升院边药房与特殊药品服务领域的专业优势。该举措有望进一步强化其市场竞争力,为患者提供更全面的医疗支持。
15:05
3D打印技术企业Carbon近日宣布完成6000万美元新一轮融资,红杉资本、银湖和阿迪达斯等原有投资方继续跟投。成立于2013年的Carbon致力于推动数字制造技术的广泛应用,助力创作者与企业实现高效、灵活的生产模式。此次融资将用于深化技术研发、拓展应用场景,并进一步降低使用门槛,加速3D打印在工业制造、消费品等领域的落地。随着投资者持续加码,Carbon...
15:05
加速进化作为人形机器人研发商,专注于开发高性能人形机器人本体及运控平台。其全自研原型采用力控关节与双足设计,旨在打造可靠稳定、动作精准的机器人产品。近日,公司完成新一轮超亿元融资,由IDG资本领投,亦庄国投跟投,源码资本、英诺天使基金等老股东持续加码。本轮资金将重点投入产品研发升级、规模化量产交付及生态平台服务建设,助力人形机器人技术实现新突破。
15:05
据央视新闻报道,北京警方近日披露一起针对高校学生的网络诈骗案。犯罪分子利用某高校发布比赛报名钉钉群二维码的机会,在未设置入群审核的情况下混入群组。这些骗子伪装成老师身份,以"同步比赛信息"为由向学生发起通话邀请。在通话过程中,诈骗分子要求开启屏幕共享,借机获取学生的身份证号、手机号、银行卡号及验证码等敏感信息。案发当晚,多名学生受骗,人均损失达数千元。警方...
15:05
2025年11月14日,神舟二十一号载人飞船返回舱在东风着陆场成功着陆。本次任务首次实施3圈自主快速返回,较此前5圈方案缩短时间3个多小时,标志着我国载人飞船再入返回技术取得新突破。中国空间技术研究院介绍,这一升级的核心在于离轨控制由地面计算转为船上计算机自主更新制动参数,大幅提升任务效率与应急能力。作为飞船“智能驾驶员”的制导、导航与控制系统(GNC系统...
15:05
深圳市恒运昌真空技术股份有限公司科创板IPO近日提交注册,从申报到提交注册仅历时5个月。作为半导体设备核心零部件供应商,该公司成立于2013年,注册资本5077万元。上市委会议重点关注公司成长性与客户依赖问题,要求说明行业市场需求、客户集中度对业务独立性的影响。财务数据显示,2022年至2024年公司营收从1.58亿元增长至5.41亿元,净利润由1981万...
15:05
九洲药业(SH603456)近日公告,公司实际控制人花轩德因年事已高,将其持有的控股股东中贝集团42.5%股权及一致行动人台州歌德10%股权,分别转让予女儿花莉蓉和花晓慧。本次转让后,花轩德不再间接持股,实际控制人变更为花莉蓉与花晓慧。二人合计控制公司35.53%股权,控股股东仍为中贝集团。以最新股价估算,此次调整涉及的间接持股市值约24.76亿元。花轩德...