腾讯发布OpenSearch-VL开源多模态搜索智能体全面解决方案

微新创想:随着多模态大语言模型(MLLMs)的飞速发展,如何让模型从“被动理解图片”进化为“主动寻找证据并推理”的智能体(Agent),已成为当前 AI 领域竞争的核心。这一转变不仅提升了模型的实用性,也推动了人工智能在现实场景中的深度应用。然而,由于高质量训练数据、自动化轨迹合成路径以及详细训练配方的缺失,顶尖的多模态搜索智能体一直难以被开源社区复现。

为了打破这一僵局,来自腾讯混元(Tencent Hunyuan)联合加州大学洛杉矶分校(UCLA)、香港中文大学等机构的研究团队正式发布了 OpenSearch-VL。这是一个完全开源的路线图,旨在通过强化学习(RL)技术打造具备前沿能力的深度搜索智能体。项目不仅提供了完整的训练框架,还为开发者提供了可复现和改进的基础。

创新数据生产线,克服“搜索捷径”研究团队指出,目前阻碍模型进化的最大瓶颈在于高质量的训练数据。为了训练出能够进行多步推理而非简单“一键识图”的模型,团队开发了一套精细的数据固化流程。该流程利用维基百科的超链接图谱进行路径采样,将复杂的实体关系转化为多跳(Multi-hop)问答。通过这种方式,模型能够更全面地理解问题,并进行更深层次的推理。

为了防止模型“偷懒”,研究人员通过模糊实体重写技术隐藏了直接答案,并引入了基于源码锚点的视觉定位技术。这种设计强迫模型必须先识别视觉线索,再结合外部工具逐步检索,从而避免了检索过程中的功能性崩坏。基于此,团队构建了包含3.6万条指令微调轨迹的 SearchVL-SFT 数据库,以及8000条用于强化学习的 SearchVL-RL 数据库。这些数据为模型的训练和优化提供了坚实的基础。

腾讯发布OpenSearch-VL开源多模态搜索智能体全面解决方案插图1

强大的工具箱:不仅仅是搜索OpenSearch-VL 并不局限于简单的文本检索。在现实场景中,用户提供的图片往往存在模糊、歪斜或分辨率低等问题,导致搜索工具失效。为此,该项目集成了一个多元化的工具环境,不仅包含网页搜索和反向图像搜索,还加入了 OCR(光学字符识别)、图像裁剪、锐化、超分辨率重建以及透视校正等功能。这意味着智能体在查询外部知识之前,会像人类一样先通过“主动感知”修复不完美的视觉输入,确保后续搜索的精准度。

“故障感知”算法:让模型从失败中学习在长路径的任务处理中,工具调用往往会产生连锁反应,一个环节的超时或错误可能导致整个任务瘫痪。传统的强化学习往往会直接丢弃这些失败的轨迹,造成训练资源的浪费。OpenSearch-VL 提出了一种名为 “多轮故障感知 GRPO” 的训练算法。该算法能够灵敏地捕捉到工具调用的“致死点”,通过掩码技术过滤掉失败后的无效信息,同时利用单边优势钳制(One-sided advantage clamping)保留故障发生前的有用逻辑。这种方式确保了模型即使在最终失败的情况下,也能学习到前期有效的搜索路径和探索策略。

实验表现比肩商业私有模型测试结果显示,OpenSearch-VL 在七项主流多模态深度搜索基准测试中表现卓越,平均性能提升超过10个百分点。在某些特定任务上,其表现已足以与目前的顶级闭源商业模型相媲美。这一成绩不仅验证了项目的有效性,也为多模态智能体的研究提供了新的方向。

目前,研究团队已计划将 OpenSearch-VL 的所有训练数据、代码及模型权重全量开源,旨在为全球开发者提供一个可复现、可改进的底层框架,推动多模态智能体研究进入“深水区”。这一举措不仅促进了技术的共享与进步,也为未来更多创新应用的开发奠定了基础。

最新快讯

2026年05月07日

14:45
微新创想:5月7日14时,全国农产品批发市场猪肉平均价格为15.12元/公斤,较前一日下降0.5%。这一变化表明市场供需关系趋于平衡,价格波动有所缓解。 同期,牛肉、羊肉、鸡蛋、白条鸡及多种水产品价格均出现环比下滑。其中,大带鱼价格降幅较为明显,达到6.1%。这些数据反映出当前肉类及水产品市场整体呈现下行趋势,可能与季节性需求变化及供应量增加有关。 重点监测...
14:45
微新创想:2026年5月7日,英国Moulton莫顿自行车在上海现所举办在华首次官方大展《空间与旅程》。此次展览不仅标志着品牌在中国市场的进一步拓展,也展示了其在自行车设计与制造领域的深厚底蕴。展览由创始人Alex Moulton博士设计手稿、关键部件拆解及全系车型陈列三大板块构成,为观众提供了深入了解品牌历史与技术精髓的机会。 活动同期全球首发新车型NS ...
14:45
微新创想:2026年5月,全球晶圆代工成熟制程产能供需格局生变。台积电、三星自2025年下半年起削减八英寸产能,叠加AI服务器带动电源管理IC等需求激增,全球前十大代工厂八英寸产能利用率升至近90%。目前八英寸代工价格已止跌回升;十二英寸成熟制程虽未供不应求,但台积电减产或引发订单转单,Tier 2厂商有望于2026年下半年启动涨价协商。
14:45
微新创想:2026年5月7日,杭州宇树科技正式全面开放UniStore官方共享应用平台。该平台作为全球首个人形机器人任务动作应用商店,为开发者和用户提供了应用开发、上架、下载及部署的一站式服务。这一举措标志着人形机器人行业迈入了一个新的发展阶段,从传统的功能机向智能化方向转变。 微新创想:平台的推出旨在降低人形机器人应用的开发与使用门槛,使用户能够像使用手机...
14:45
微新创想:《尘白禁区》将于2026年5月8日14:00正式恢复服务器运营 游戏自3月2日23:59起进入停机维护状态 维护时间已超过两个月 官方已明确表示 在停机前已领取但尚未使用的限时道具 包括“员工惠利”部分 将继续保留其剩余的有效时间 “自往昔归还”活动的部分环节将延期至5月15日04:00进行 为感谢玩家的支持与理解 游戏方准备了多项补偿措施 包括高...
14:45
微新创想:2026年5月20日至21日,第六届亚洲科技峰会(ATxSummit)在新加坡嘉佩乐酒店成功举办。此次峰会由新加坡资讯通信媒体发展局主办,汇聚了来自50多个国家的4000余名政企领袖和技术专家。与会者包括世界银行集团、英伟达、谷歌、亚马逊及OpenAI等国际知名机构的代表。他们围绕人工智能对经济、产业与社会带来的深刻变革展开深入研讨。峰会聚焦于亚洲...
14:45
微新创想:5月7日,新石器公司向双汇物流批量交付常温及无人冷链配送车。此次交付覆盖双汇物流全国网络,涉及冷鲜肉门店与核心冷链仓间的物资调拨。新石器主导实施此次交付,双汇物流负责后续运营,双方合作旨在提升生鲜供应链末端配送效率与温控可靠性。 无人冷链配送车具备L4级自动驾驶能力,能够实现高度智能化的运输与配送。其设计充分考虑了多温层货物运输需求,可在不同温度环...
14:45
微新创想:2026年5月7日,苏州瑞博生物技术股份有限公司及子公司Ribocure Pharmaceuticals AB宣布,与勃林格殷格翰合作的肝脏疾病创新疗法项目取得新进展。该项目在德国和中国同步推进,由双方联合研发RNA靶向治疗药物,旨在解决难治性慢性肝病临床需求。此次里程碑涉及关键临床前研究数据验证及后续IND申报路径确认。合作基于2023年签署的全...
14:45
微新创想:2026年5月,GMAC发布的《潜在学生调查报告》揭示了一个重要趋势,即大中华区MBA申请人正因技术不确定性而更加重视实用技能的培养。然而,他们对商科教育的核心诉求依然集中在战略思维与问题解决等软实力方面。 报告调研范围覆盖了不同年龄段的考生,显示出商科教育在塑造个人“能力护城河”上的独特价值与不可替代性。这一发现表明,随着技术环境的不断变化,MB...
14:45
微新创想:2026年5月,美国Capital Group宣布将在阿布扎比国际金融中心(ADGM)设立其中东首家办事处,预计于2026年晚些时候开业,尚待监管批准。该办事处将成为其全球第35个分支机构,旨在强化本地服务能力并深化与全球平台的协同。 微新创想:欧洲及亚洲机构业务负责人Benno Klingenberg-Timm将兼任阿布扎比办事处负责人。此举旨在...
14:41
微新创想:5月7日消息 据媒体报道 近日山西太原的一场婚礼在社交平台上引发了广泛关注 婚礼现场的拱门上印着“房东先生 王女士”的字样 路人拍下并上传后瞬间引来热议 不少网友调侃新娘这是直接嫁给了房东 新娘王女士对此回应称 她和丈夫都是95后 两人去年8月因工作交集相识 在后续的频繁接触中 双方逐渐产生好感并走到了一起 所谓的房东先生其实是新郎的真实姓名 并非...
14:41
微新创想:民间常说吃得苦中苦方为人上人 这种观点认为只有经过挫折的洗礼 人的各方面才能得到锻炼并超越他人 随着生活条件的极大改善 现代人已很少面对物质匮乏的窘境 于是 不少家长认为新一代的成长环境过于舒适 甚至开始人为制造一些苦难来磨砺孩子 然而 发表在《自然》旗下子刊《分子精神病学》的一篇文章却揭示了残酷的真相 研究指出 吃苦 特别是早年间的逆境 对大脑发...