Jan-v2-VL-Max发布 30B多模态模型专攻长周期Agent任务稳超Gemini 2.5 Pro

在人工智能领域,智能体(Agent)正迈向复杂多步任务的新纪元,而开源社区近日迎来了一位实力强劲的新成员——Jan团队正式发布了Jan-v2-VL-Max模型。这款拥有300亿参数的多模态大模型,专为长周期、高稳定性的自动化执行场景而设计,在多项关键指标上已超越谷歌Gemini2.5Pro与DeepSeek R1,为开源Agent生态注入了强大的发展动力。

Jan-v2-VL-Max发布 30B多模态模型专攻长周期Agent任务稳超Gemini 2.5 Pro插图1

当前多模态Agent在执行长序列操作时,常面临“误差累积”的难题。例如在自动化UI操作或跨应用任务流中,微小偏差可能引发后续任务全面偏离。为攻克这一挑战,Jan-v2-VL-Max创新性地引入了LoRA-based RLVR(Reinforced Long-horizon Vision-Language Reasoning)技术,在继承Qwen3-VL-30B基座能力的同时,大幅提升了推理链的一致性与抗干扰能力,确保任务在数十步操作后仍能精准执行。

在全新评测基准“幻象递减回报”(Hallucination-Decay Return,HDR)中,Jan-v2-VL-Max表现卓越。该基准专门衡量Agent在任务长度延伸过程中,因幻觉或逻辑断裂导致回报率下降的速度。Jan-v2-VL-Max在长序列任务中始终保持高回报稳定性,超越Gemini2.5Pro与DeepSeek R1,验证了其在真实自动化场景中的可靠性。

Jan-v2-VL-Max发布 30B多模态模型专攻长周期Agent任务稳超Gemini 2.5 Pro插图2

为降低使用门槛,Jan团队提供了便捷的解决方案:
– 网页端直接交互界面,用户可上传图像、输入指令,实时测试多步自动化流程;
– vLLM优化本地部署方案,支持在消费级GPU上高效运行,便于开发者集成至自研Agent系统。

Jan-v2-VL-Max虽在长序列执行上相较基座模型仅实现“小幅提升”,但在Agent领域,每1%的稳定性提升都意味着可用性质的飞跃。这一成果标志着开源社区正从“单步响应”迈向“长程规划”,为UI自动化、机器人控制、多工具协同等高价值场景提供可落地的开源基座。AIbase认为,当大模型竞争从“谁更聪明”转向“谁更可靠”,Jan团队此次聚焦执行稳定性的技术路径,恰逢其时。在Agent即将成为AI主交互范式的浪潮下,Jan-v2-VL-Max或将成为开发者构建“永不掉链子”智能体的关键拼图。

最新快讯

2025年12月24日

17:02
南京666路公交车上上演一幕令人啼笑皆非的意外,乘客抬脚避让时裤腿竟被邻座大爷塑料袋中露出的带鱼鱼钩勾住,这场充满戏剧性的巧合被网友戏称为“被带鱼咬”,迅速引爆网络热搜。 据现场目击者周女士回忆,当时她正站在车厢中部,突然发现邻座大爷携带的黑色塑料袋中露出带鱼鱼头,下意识抬脚避让时,带鱼嘴部的鱼钩却精准地勾住了她的裤腿纤维,形成了一场“鱼与人的奇妙连接”...
17:02
哈尔滨冰雪大世界的超级雪雕"大雪人"最近意外走红,全靠一位东北小萌娃的脑洞大开。这位小朋友在拍摄雪人时,突然尝试从后脑勺角度取景,这种充满童趣的创意被家长拍下上传网络后,迅速引爆全网热议。与传统宣传片刻板呆板的推介方式不同,孩子们毫无造作的真实互动,不仅展现了冰雪文化的无穷魅力,更生动诠释了东北人热情豪爽的独特气质。 社交平台上,"萌娃带你看哈尔滨"的旅游攻...
17:02
今年黑五期间,POP MART的TikTok Shop团队将圣诞节的欢乐氛围完美融入直播间,通过「新品发售、阶梯式满赠优惠、48小时闪电发货」等密集福利,将节日庆典与黑五大促的喜悦推向高潮,更将顶级IP的魅力与圣诞节的温馨氛围在直播间呈现得淋漓尽致。这一幕只是POP MART在TikTok Shop跨境自运营(POP)模式下的精彩缩影。黑五期间,平台携手25...
17:02
声明:本文源自微信公众号《光子星球》,作者胥植,经站长之家授权转载发布。吉利汽车集团副总裁、吉利汽车研究院院长李传海在WAIC2025上公开表示"吉利有望从车企转变为中国乃至全球最大的机器人公司",这一观点引发外界广泛关注。外界惊讶之余,更多是认同。银河品牌助力下,吉利今年汽车销量全面爆发,前11个月总销量同比增长42%,新能源车增长97%,远超行业平均水平...
17:02
辽宁锦州近日发生一起令人瞠目的黄金盗窃案,一名男子家中价值不菲的100克黄金不翼而飞,引发社会广泛关注。案发后,受害者惊魂未定,其发小却主动提出陪同前往派出所报案,这一看似仗义的行为却暗藏玄机。民警在接警后敏锐察觉到异常,经过细致勘查与缜密分析,最终揭穿这起精心策划的“贼喊捉贼”闹剧,将犯罪嫌疑人绳之以法。 办案民警透露,受害者报案时,其发小全程陪同且表现异...
17:01
微新创想12月24日重磅消息,今年春季苹果正式推出iPhone 16e,起售价仅为4499元。这一新机型的问世,伴随着苹果从官网悄然下架iPhone SE的举动,预示着苹果将正式确立e系列作为独立产品线的战略布局,逐步取代原有的SE系列。根据行业惯例,明年春季苹果将迎来16e的迭代升级款iPhone 17e。知名数码博主定焦数码率先爆料,iPhone 17e...
16:49
元宝正式发布《元宝xDeepSeek年度报告》,全面揭示AI助手在真实场景中的深度应用与用户交互图景。报告显示,自2025年元宝接入DeepSeek的第315天起,这份年度数据报告为我们呈现了AI助手如何重塑用户数字生活体验。数据显示,当前元宝平台中超过三分之一DeepSeek对话能够持续两轮以上,用户在"深度思考"与"快思考"的交互模式中,后者占比高达七成...
16:26
上汽通用五菱重磅官宣,旗下首款“全能硬派大空间SUV”——星光560将于2026年1月震撼登场,正式开启预售。新车凭借其卓越的产品实力,将重新定义家用SUV的标杆标准。据悉,星光560将提供燃油版、插电混动版以及纯电动版三种动力选择,满足消费者多样化的出行需求。首发权益价区间设定在5.98万至9.88万元,极具市场竞争力。 新车整车尺寸长宽高分别为4745m...
16:26
2025年12月24日,中国人民银行携手交通运输部、商务部等八部门共同发布《关于金融支持加快西部陆海新通道建设的意见》,这份具有重要战略意义的文件提出了21条具体举措,为西部陆海新通道的加速发展注入强劲动力。意见明确指出,将着力完善金融组织体系与资金融通机制,通过创新金融产品与服务模式,构建更加高效的金融服务生态。特别值得关注的是,文件明确支持重庆设立陆海新...
16:26
2025年12月24日,台湾知名电子书平台Readmoo读墨正式宣布进军移动阅读新领域,宣布已启动手机型电子书阅读器的研发工作。这一战略举措旨在进一步拓展其市场版图,精准满足当下用户对于便携式阅读体验的迫切需求。值得注意的是,Readmoo近期刚刚推出了一款备受瞩目的7英寸mooInk Nana巧克力马丁尼新配色机型,该设备搭载了先进的元太Kaleido 3...
16:26
2025年12月24日,备受期待的《微软飞行模拟2024》迎来重磅更新,正式推出与经典科幻剧集《怪奇物语5》的深度联动内容。此次更新不仅为全球玩家免费开放下载,更以惊人的细节还原了1987年霍金斯小镇的独特风貌,让飞行爱好者们有机会从空中俯瞰这个充满神秘色彩的小镇。 本次更新精心还原了多个标志性地点,包括令人怀念的皇宫游乐场、充满怀旧气息的家庭录像带店等,每...
16:26
2025年12月24日,备受瞩目的具身智能领域创新企业格松科技正式宣布成功完成新一轮亿元级融资,此次融资由知名投资机构昆仲资本与英诺天使基金联合领投。这一重要里程碑不仅为格松科技注入了强劲的资金支持,更为其加速具身智能技术的研发与量产落地提供了坚实保障。作为专注于具身智能领域的先行者,格松科技凭借其前瞻性的技术布局和卓越的研发实力,在本次融资中赢得了资本市场...