艾伦AI开源Molmo2视频语言模型 支持多模态推理

艾伦人工智能研究所(Ai2)近日重磅发布全新开源视频语言模型 Molmo2 系列,这一系列创新模型及其配套训练数据充分彰显了该非营利机构在开源领域的坚定决心与持续投入。在当前企业日益关注模型使用自主权的背景下,此次发布无疑为业界带来了重大利好消息,为模型开发者提供了更多掌控权和灵活性。

Molmo2 系列涵盖了多种模型版本,其中 Molmo2-4B 和 Molmo2-8B 分别基于阿里巴巴 Qwen3 语言模型构建,而 Molmo2-O-7B 则是完全开源的 Ai2Olmo 语言模型版本。这些多样化的模型选择能够满足不同应用场景的需求,为开发者提供更丰富的技术支持。除了核心模型之外,Ai2 还同步推出了九个全新的数据集,包括多图像和视频输入的长格式质量保证数据集,以及开放的视频指向和跟踪数据集,为模型训练提供了更丰富的数据资源。

Molmo2 最引人注目的特点在于其显著增强的功能。根据 Ai2 的详细介绍,Molmo2-O-7B 模型具有高度透明性,支持用户进行端到端的深入研究和定制化开发。这意味着用户可以全面访问视觉语言模型及其语言学习模型(LLM),从而根据具体需求灵活调整模型参数,实现更精准的应用效果。Molmo2 模型能够支持用户就图像或视频内容提出问题,并基于视频中识别的模式进行智能推理。Ai2 感知推理与交互研究主管 Ranjay Krishna 指出,这些模型不仅能给出答案,还能在时间和空间维度上明确标注事件发生的具体时刻,为用户带来更直观的交互体验。

除了强大的推理能力外,Molmo2 还具备多项实用功能,包括自动生成描述性字幕、精准追踪物体数量,以及检测长视频序列中的罕见事件等。这些功能极大地拓展了视频语言模型的应用范围,为内容创作、视频分析等领域提供了新的技术解决方案。用户可以通过 Hugging Face 和 Ai2Playground 平台体验 Molmo2 模型,后者是 Ai2 专门搭建的模型体验平台,集成了多种实用工具和前沿模型,为开发者提供一站式的技术体验。

艾伦AI开源Molmo2视频语言模型 支持多模态推理插图1

此次 Molmo2 系列的发布再次彰显了 Ai2 对开源技术的坚定承诺。分析师 Bradley Shimmin 指出,在当前重视数据主权的时代背景下,模型相关数据和权重的开放共享对企业至关重要。Molmo 系列模型参数控制在 40 亿或 80 亿个范围内,参数规模适中,既保证了模型性能,又降低了企业应用成本,使其更具市场竞争力。Shimmin 强调,企业正在逐渐认识到,模型大小并非唯一关键指标,训练数据的透明度和模型的可定制性同样重要,这些因素将直接影响企业的技术选型和应用效果。

项目官网:https://allenai.org/blog/molmo2

划重点:
1. 🚀 Ai2 发布 Molmo2 系列开源视频语言模型,显著增强企业对模型使用的掌控能力。
2. 🎥 新模型支持多图像和视频输入,具备事件推理和生成描述性字幕等强大功能。
3. 📊 Ai2 坚持开源承诺,强调数据透明度和模型定制化的重要性,为企业提供更灵活的技术选择。

最新快讯

2025年12月18日

12:26
2025年12月18日,中国气象局正式发布《地球系统预报发展战略(2025—2035年)》,为未来十年乃至更长时间的气象预报领域发展擘画了宏伟蓝图。该战略明确提出,到2035年将建成自主可控、国际一流的地球系统预报体系,标志着我国在气象科技领域迈向更高水平的重要里程碑。 该战略规划分两个关键阶段稳步推进。在2025年至2030年的第一阶段,将重点实现新一代预...
12:26
2025年12月18日,备受瞩目的2025光伏行业年度大会隆重召开。中国光伏行业协会名誉理事长王勃华在会上发布重磅数据,揭示了行业最新发展趋势。据他透露,2025年1至10月期间,我国多晶硅产量约为111.3万吨,与去年同期相比大幅下降29.6%,这一数据创下自2013年以来的最大降幅。与此同时,硅片产量也呈现明显下滑态势,同期产量约567吉瓦,同比下降6....
12:26
2025年12月16日,小岛工作室迎来了激动人心的十周年庆典。这一重要时刻不仅标志着工作室十年的辉煌历程,更彰显了其对创新与探索的不懈追求。为庆祝这一里程碑,工作室特别发布了十周年纪念版Ludens形象,该形象身着未来感十足的太空战甲,眼神坚定地望向星辰大海,生动诠释了人类探索未知世界的勇气与决心。这一设计不仅展现了小岛工作室独特的艺术风格,更传递出其对未来...
12:26
2025年12月18日,备受瞩目的核聚变能源技术领军企业零点聚能正式宣布成功斩获超五千万元天使轮融资。这一重要里程碑不仅彰显了资本市场对零点聚能创新技术的的高度认可,更为其未来发展注入强劲动力。据悉,本次融资所得将全部用于核心项目——一号实验装置的研制与建设,重点开展磁零点约束位形聚变这一前沿路线的关键性实验验证。作为聚变能源领域的探索者,零点聚能始终致力于...
12:26
2025年12月18日,自动驾驶领域的领军企业Momenta与东南亚领先的出行平台Grab正式宣布达成深度战略合作,并宣布Grab将对其进行战略投资。这一强强联合标志着双方将共同致力于在东南亚地区加速自动驾驶技术的商业化进程,特别是在人口密度高、交通环境复杂的城市区域。通过整合各自的核心优势,双方将携手开启东南亚智慧出行的新篇章。 此次合作的核心目标是将Mo...
12:26
2025年,环旭电子在越南海防的工厂将迎来重大扩张,计划将月产800G/1.6T硅光光模块的产能提升至10万只。自2021年正式投产以来,这家工厂已成功构建起5万平方米的现代化生产面积,并展现出强劲的增长势头。据最新数据显示,今年智能手表SiP模块及工业产品的营收已突破8亿美元大关,彰显了其卓越的市场表现和技术实力。 此次新建产线将是环旭电子全球战略布局的重...
12:26
2025年12月17日,全球顶尖商学院欧洲工商管理学院(INSEAD)震撼发布了一项革命性创新——Botipedia,即全球最大规模的百科全书式知识门户。这一平台凭借其专有的AI技术引擎,通过整合数百种精密算法,成功模拟人类协作模式,能够自动生成高度专业化的维基百科风格条目内容。Botipedia的核心使命是构建一个覆盖全球范围、实时动态更新的综合性知识库,...
12:26
2025年12月18日,CAI控股正式宣布一项具有战略意义的投资计划,拟收购亚洲新兴资产管理服务领域的领先企业Forestheaven约9.09%的股权。Forestheaven作为一家专注于资产管理、证券咨询及证券交易服务的专业机构,近年来在虚拟资产领域也展现出前瞻性的布局布局。此次收购动作发生在中国企业加速拓展亚洲金融市场的大背景下,不仅体现了CAI控股...
12:26
2025年12月18日,荷兰阿姆斯特丹大学的物理学家们取得了一项令人瞩目的突破,他们巧妙地运用蒸发冷却原理,在真空腔体内仅利用水和喷嘴,成功3D打印出一棵高达8厘米的微型冰制圣诞树。这项创新技术彻底颠覆了传统冰雕制作方式,无需依赖任何传统制冷设备,而是通过精准控制水在低压环境下的快速蒸发,利用蒸发过程带走的热量使剩余水瞬间冻结成型。这一过程不仅高效节能,更为...
12:26
2025年12月,国内3D打印领域迎来新动态,专注于轻量化智能制造解决方案的品牌轻量智造成功完成天使轮融资。此次投资由激光器行业领军企业海目星科技强势追加,同时南山战新投也积极参与跟投,加上前期孵化机构的支持,两轮累计融资金额已突破数千万元大关。作为3D打印批量制造领域的先行者,轻量智造凭借其创新技术迅速崭露头角,其首款产品已顺利完成样机开发,技术成熟度显著...
11:56
罗福莉,这位被誉为"天才少女"的AI研究者,近期在小米的舞台上大放异彩。从年初与雷军接触到离职,再到本月加入小米并亮相"人车家全生态大会",她带来的新模型MiMo-V2-Flash,为小米在AI领域的布局交出了一份亮眼的成绩单。这个参数量达309B、激活参数15B的模型,虽然罗福莉本人不愿称之为"大模型",但在小米团队的构想中,它将成为Agent训练的坚实基...
11:56
人类与机器人共生的时代或许比我们想象的更近。英伟达创始人黄仁勋曾预言"AI的下一波浪潮将是机器人系统",并断言未来十年工厂将完全由软件和AI驱动。这一预言如今正转化为资本市场的实际行动。仅过去数月,仙工智能等十余家机器人企业密集向港交所递交招股书,宇树科技等头部企业加速推进IPO进程。截至12月8日,已有34家机器人产业链企业排队等待聆讯。一级市场同样火爆,...