艾伦AI开源Molmo2视频语言模型 支持多模态推理

艾伦人工智能研究所(Ai2)近日重磅发布全新开源视频语言模型 Molmo2 系列,这一系列创新模型及其配套训练数据充分彰显了该非营利机构在开源领域的坚定决心与持续投入。在当前企业日益关注模型使用自主权的背景下,此次发布无疑为业界带来了重大利好消息,为模型开发者提供了更多掌控权和灵活性。

Molmo2 系列涵盖了多种模型版本,其中 Molmo2-4B 和 Molmo2-8B 分别基于阿里巴巴 Qwen3 语言模型构建,而 Molmo2-O-7B 则是完全开源的 Ai2Olmo 语言模型版本。这些多样化的模型选择能够满足不同应用场景的需求,为开发者提供更丰富的技术支持。除了核心模型之外,Ai2 还同步推出了九个全新的数据集,包括多图像和视频输入的长格式质量保证数据集,以及开放的视频指向和跟踪数据集,为模型训练提供了更丰富的数据资源。

Molmo2 最引人注目的特点在于其显著增强的功能。根据 Ai2 的详细介绍,Molmo2-O-7B 模型具有高度透明性,支持用户进行端到端的深入研究和定制化开发。这意味着用户可以全面访问视觉语言模型及其语言学习模型(LLM),从而根据具体需求灵活调整模型参数,实现更精准的应用效果。Molmo2 模型能够支持用户就图像或视频内容提出问题,并基于视频中识别的模式进行智能推理。Ai2 感知推理与交互研究主管 Ranjay Krishna 指出,这些模型不仅能给出答案,还能在时间和空间维度上明确标注事件发生的具体时刻,为用户带来更直观的交互体验。

除了强大的推理能力外,Molmo2 还具备多项实用功能,包括自动生成描述性字幕、精准追踪物体数量,以及检测长视频序列中的罕见事件等。这些功能极大地拓展了视频语言模型的应用范围,为内容创作、视频分析等领域提供了新的技术解决方案。用户可以通过 Hugging Face 和 Ai2Playground 平台体验 Molmo2 模型,后者是 Ai2 专门搭建的模型体验平台,集成了多种实用工具和前沿模型,为开发者提供一站式的技术体验。

艾伦AI开源Molmo2视频语言模型 支持多模态推理插图1

此次 Molmo2 系列的发布再次彰显了 Ai2 对开源技术的坚定承诺。分析师 Bradley Shimmin 指出,在当前重视数据主权的时代背景下,模型相关数据和权重的开放共享对企业至关重要。Molmo 系列模型参数控制在 40 亿或 80 亿个范围内,参数规模适中,既保证了模型性能,又降低了企业应用成本,使其更具市场竞争力。Shimmin 强调,企业正在逐渐认识到,模型大小并非唯一关键指标,训练数据的透明度和模型的可定制性同样重要,这些因素将直接影响企业的技术选型和应用效果。

项目官网:https://allenai.org/blog/molmo2

划重点:
1. 🚀 Ai2 发布 Molmo2 系列开源视频语言模型,显著增强企业对模型使用的掌控能力。
2. 🎥 新模型支持多图像和视频输入,具备事件推理和生成描述性字幕等强大功能。
3. 📊 Ai2 坚持开源承诺,强调数据透明度和模型定制化的重要性,为企业提供更灵活的技术选择。

最新快讯

2025年12月17日

13:07
12月16日,英国桑德兰迎来历史性时刻,远景动力全球领先的电池超级工厂正式投产。这座现代化工厂规划年产能高达15.8GWh,不仅刷新了英国电池生产规模的纪录,更将成为欧洲电动化转型的重要引擎。工厂专注于满足欧洲市场对电动汽车和储能系统的需求,通过高效的生产线和先进技术,为绿色出行和清洁能源应用提供坚实保障。 此次投产是远景动力全球化战略的重要里程碑。继法国杜...
13:07
2025年12月26日,《逆水寒》手游将迎来备受期待的3.2.3版本更新,正式开启全新敦煌大地图的探索之旅。这一宏大地图精心还原了月牙镇、莫高窟、玉门关等标志性场景,并特别引入了莫高窟壁画的数字化复原技术,让玩家能够沉浸式体验千年敦煌的艺术魅力。 新版本不仅带来视觉盛宴,更创新性地加入了“冥想”“描摹”两大核心玩法,旨在引领玩家进入独特的“心流世界”。在...
13:07
2025年12月16日最新消息显示,备受瞩目的2027年《使命召唤》新作将由大锤工作室倾力打造,并正式宣告与“现代战争”及“黑色行动”系列Say Goodbye。这款备受期待的新作将开启全新的故事篇章,背景设定横跨20世纪90年代末至21世纪初的动荡年代,为玩家带来耳目一新的沉浸式体验。在角色阵容方面,游戏将启用全新的主角团队,预计将带来更多元化的人物设定和...
13:07
2025年12月17日,备受瞩目的小米人车家全生态合作伙伴大会在北京隆重举行。这场汇聚行业精英的盛会不仅标志着小米在智能出行领域的又一里程碑,更见证了小米集团副总裁罗福莉的首次公开亮相。罗福莉在会上发表了主题演讲,详细阐述了小米在人工智能领域的最新突破与战略布局。 她着重强调,小米开源模型的代码能力与智能体(agent)能力在国际权威评估榜单中表现卓越,已稳...
13:07
2025年12月16日,韩国大田市正式启动了一项创新性的人工智能道路安全测试项目,旨在通过科技手段显著提升冬季行车安全。该项目在隧道入口、桥梁区域、急弯路段等六类高风险区域密集部署了超声波传感器网络,构建起全方位的路面状态监测体系。这些传感器能够实时捕捉路面细微变化,特别针对冬季常见的"黑冰"现象进行重点监测,这种难以肉眼识别的薄冰层往往是引发交通事故的隐形...
13:07
2025年12月17日,金禄电子通过官方互动平台正式宣布,其自主研发生产的PCB(印制电路板)产品已成功应用于新能源汽车充电设备领域。这一重要进展不仅彰显了公司在高端电子元器件领域的制造实力,更标志着金禄电子在新能源汽车产业链中的战略布局迈出了坚实一步。 作为行业领先的PCB解决方案提供商,金禄电子凭借卓越的技术研发能力和严格的质量管理体系,已逐步在新能...
13:07
2025年12月17日,全球领先的流媒体音乐平台Spotify与韩国知名信息技术巨头Naver正式宣布达成战略合作,在韩国市场推出创新的音乐整合服务。此次深度合作将Spotify的海量音乐资源无缝嵌入Naver的核心平台,包括其主流搜索引擎、智能地图服务以及备受青睐的Naver+会员生态系统。通过这一协同举措,韩国用户将能够在Naver平台内部直接畅享Spo...
13:07
2025年12月16日,摩托罗拉正式发布旗下新款中端手机Moto G Power(2026),这款手机以卓越的护眼功能和超长续航能力为核心卖点,为用户带来全新的移动体验。Moto G Power(2026)配备了一块6.6英寸120Hz LCD屏幕,采用先进的无PWM频闪技术,有效减少蓝光伤害,长时间使用也能呵护用户双眼健康。此外,该机还贴心保留了3.5mm...
13:07
2025年12月17日,一则引人注目的消息在航空业掀起波澜——全球知名的私募股权公司Apollo正积极考虑出售其手中持有的阿特拉斯航空公司股份。据行业内部消息透露,这项潜在的资产剥离交易目前仍处于初步探索阶段,但Apollo已初步设定了超过120亿美元(包含债务估值)的出售目标,显示出其对此次交易的重视程度。作为全球货运航空领域的佼佼者,阿特拉斯航空近年来凭...
13:06
2025年12月17日,备受瞩目的医疗器械与健康服务企业极瞰健康正式宣布成功完成天使轮融资,投资方为实力雄厚的合银投资。此次融资不仅为极瞰健康注入了强劲的资金支持,更彰显了资本市场对其创新商业模式和广阔发展前景的高度认可。据悉,本轮融资所得资金将全面用于产品研发升级、市场战略拓展以及核心团队建设三大方面,旨在进一步提升产品竞争力,扩大市场占有率,并打造一支高...
13:06
2025年12月17日,备受瞩目的去中心化预测市场平台Space成功斩获300万美元种子轮与战略级融资,标志着其在区块链金融领域的又一重大突破。本轮融资由知名风险投资机构Morningstar Ventures与Arctic Operators联合领投,同时吸引了Echo、Curated(由Impossible Finance精心策划)等平台的社区投资者积极...
12:08
浙江近日出现一起引人关注的现象,一名小男孩因长期反复舔舐下巴,皮肤上竟形成了一圈明显的环状红斑,被网友形象地称为“羊胡子疮”。这一现象迅速引发社会热议,也让我们不得不重新审视儿童皮肤健康问题。 据了解,该男孩的皮肤问题源于长期无意识的舔舐行为。唾液中含有多种酶类物质,当这些物质持续刺激皮肤时,就会导致皮肤屏障受损,最终形成边界清晰的红斑、脱屑。医学上,这...