2026年1月30日,商汤科技正式开源了其首个支持动态视觉推理与图文搜索深度融合的 Agentic VLM 模型——SenseNova-MARS。该模型包含8B 和32B 两个版本,通过模拟“侦探破案”般的逻辑,实现了 AI 从单纯“理解”到自主“执行”的跨越。

性能飞跃:在多项榜单超越 GPT-5.2

最新的行业基准测试中,SenseNova-MARS展现出了惊人的竞技状态:

搜索推理登顶:在 MMSearch(图文搜索核心评测)中以74.27分 登顶,显著超过GPT-5.2的66.08分。

细节搜寻领跑:在 HR-MMSearch(高清细节搜索评测)中获得54.43分,拉开了与主流闭源模型的差距。

多维能力验证:在 FVQA、InfoSeek 等多个权威视觉理解榜单中,均取得了开源模型中的 SOTA(当前最佳) 成绩。

核心黑科技:像人类一样协同工具

SenseNova-MARS的独特之处在于其“自主规划”能力,能够自动解决“细节识别 + 信息检索 + 逻辑推理”的复杂长链条任务:

图像细节裁剪:能聚焦占比不到5% 的微小细节(如赛车手服上的 Logo),并自动放大分析。

动态图文搜索:在识别物体或人物的瞬间,自动匹配全球范围内的相关信息,如设备型号或行业数据。

多跳深度推理:面对需要“先放大、再识别、最后查背景”的任务不再束手无策,具备极强的“工具使用直觉”。

训练秘籍:“因材施教”的双阶段演进

商汤研究团队通过两阶段训练,赋予了模型严密的逻辑链条:

第一阶段(打基础):利用自动化数据合成引擎构建“高难度案例库”,让 AI 学习基本的多跳搜索逻辑,确保起步即面对真实复杂场景。

第二阶段(练实战):引入 BN-GSPO 算法进行强化学习,像训练侦探一样,通过奖励机制平滑波动,让模型在处理各类问题时都能保持稳定进步。

拥抱开源:助力全球开发者

目前,商汤已将SenseNova-MARS的模型、代码及数据集全量开源。开发者可直接通过 Hugging Face 下载,共同探索具身智能与自主 Agent 的无限可能。

最新快讯

2026年01月30日

17:08
在发布仅六个月后,OpenAI 旗下的 ChatGPT Agent 正面临被停用的危机。据最新报道显示,该产品的用户量已从高峰期的 400 万每周活跃付费用户,暴跌至不足 100 万,流失率高达 75%。尽管在发布初期吸引了约 11% 的订阅用户尝试,但 ChatGPT Agent 很快就陷入了增长停滞。主要原因在于,大多数用户根本无法理解这个工具的实际用途...
17:08
近日,网络安全公司 SentinelOne 与 Censys 联合发布的一项深度研究揭示了开源大语言模型面临的严峻安全挑战。 研究指出,当这些模型脱离主流托管平台的“护栏”与安全限制,在外部私有计算机上独立运行时,极易沦为黑客与犯罪分子的攻击目标,产生严重的安全风险。这项耗时近 300 天的研究发现,目前互联网上存在数千个缺乏保护的开源 AI 运行实例,其中...
17:03
近日,一段美国小伙在餐厅内拉制中国拉面的视频在网络上迅速走红。视频中,这位金发碧眼的年轻人手法娴熟,面团在他手中如绸带般翻飞,瞬间化作根根细长均匀的面条,动作之丝滑令人赞叹不已。据网友描述,这一幕发生在某家餐厅内,美国小伙的出色表现不仅吸引了周围食客的目光,更在网络上引发了广泛热议。许多网友纷纷表示,这位美国小伙的拉面技艺堪称一...
17:03
1月28日消息,浙江宁波的一位幸运儿郑先生(化姓)与家人一同现身浙江省体育彩票管理中心,喜气洋洋地领取了733万元的大奖,其中包括1注一等奖,单票奖金总额高达733万元。据郑先生介绍,他购买彩票的心态十分随缘,并无特别的购彩计划或习惯。每天买菜时,他会顺道光顾体彩实体店,每次的购彩金额也仅在十元左右。对于郑先生的这一爱好,其家人...
17:03
近日,一则关于相亲消费的新闻引发了广泛关注。据报道,苏女士与王先生通过婚介公司介绍,进行了初次约会并相约就餐。然而,这顿餐食的消费金额却高达8000元,更令人意想不到的是,用餐结束后,男方王先生竟以去卫生间为由离开,随后便彻底失联。面对这突如其来的变故,苏女士多次尝试联系王先生,但均未得到回应。在无奈之下,她只能独自承担了这笔高...
17:03
2026年1月30日,特斯拉在备受瞩目的2025年四季度财报发布会上投下重磅消息——正式宣布即日起停产Model S和Model X两款旗舰车型。这一战略调整不仅标志着特斯拉在汽车制造领域的阶段性转型,更彰显了其向"物理人工智能公司"的宏伟目标迈进。马斯克在发布会上明确将Optimus人形机器人提升至公司未来发展的核心地位,并公布了雄心勃勃的生产计划:计划在...
17:03
2026年1月,游戏开发者大会(GDC)发布《2026游戏行业状况》报告。调查显示,在2300名受访从业者中,28%过去两年内被裁员,美国达33%;17%仅在过去一年失业。2023至2024年行业超1.6万人离职,2025年微软游戏部门再裁9000人,育碧2026年启动大规模重组。48%被裁者尚未就业,36%失业超一至两年仍未重返岗位。74%游戏专业学生担...
17:03
2026年1月29日,Deku Deals平台最新发布的数据揭示了一个令人瞩目的现象:任天堂Switch 2推出的“钥匙卡”实体卡带,尽管因需依赖下载游戏且缺乏本地存储内容而引发玩家热议,却依然展现出惊人的市场号召力。在针对1070名收藏第三方实体游戏的用户进行的专项调查中,高达735人(占比75.8%)已至少拥有一款钥匙卡,显示出其在核心玩家群体中的广泛认...
17:03
1月30日,腾讯旗下“元宝派”进入公测倒计时。该产品新增“一起听音乐”与“一起看视频”功能,疑似实现QQ音乐与腾讯视频内容库互通,并支持用户免费享用部分会员内容。目前官方尚未公布具体上线日期。此举旨在强化多平台协同体验,提升用户粘性与生态整合效率。
17:03
1月29日,多家媒体报道称,埃隆·马斯克正评估整合SpaceX、xAI及特斯拉资源,推进太空人工智能算力基础设施建设。据悉,方案包括在近地轨道部署由SpaceX运营的数据中心,为xAI提供算力支持;并利用特斯拉储能技术,配合太空太阳能供电。此外,马斯克还探讨以“星舰”火箭将特斯拉“擎天柱”机器人运送至月球和火星。目前相关构想仍处早期探讨阶段,尚未形成最终决...
17:03
1月30日,航天动力(600343.SH)发布业绩预告称,预计2025年归母净利润为-2.10亿元至-1.78亿元。公司主营受产品品类与型号收缩及市场环境影响,收入同比下降约10%,拖累利润约1.05亿元;因产品转型、订单变更致部分存货减值,计提跌价准备约3200万元;另因新国标实施,部分设备及专利减值,计提资产减值准备约1600万元。
17:03
1月30日,京东七鲜超市北京西红门荟聚店与上海浦东世纪汇店同步开业。两店分别位于北京大兴区与上海浦东新区,由京东旗下生鲜零售品牌七鲜运营。此举旨在强化华东市场布局,并推动全国化战略升级。新店延续产地直采与仓店融合模式,叠加本地化选品及精准客群运营,服务春节前消费高峰。双店联动标志着七鲜从区域深耕迈向全国化竞争的关键一步。