蚂蚁开源Ming-Flash-Omni 2.0性能对标Gemini 2.5 Pro全模态大模型

微新创想
今日,蚂蚁集团正式开源发布全模态大模型 Ming-Flash-Omni 2.0。该模型在多项公开基准测试中展现出卓越的性能,尤其在视觉语言理解、语音可控生成、图像生成与编辑等关键领域表现突出,部分指标甚至超越了 Gemini 2.5 Pro,成为当前开源全模态大模型中的性能新标杆。Ming-Flash-Omni 2.0 作为业界首个全场景音频统一生成模型,能够在一个音轨中同时生成语音、环境音效与背景音乐,极大提升了音频生成的灵活性和实用性。

用户只需通过自然语言下达指令,即可对音色、语速、语调、音量、情绪与方言等进行精细控制。这种高度定制化的音频生成能力,使得模型在实际应用中更具优势。此外,Ming-Flash-Omni 2.0 在推理阶段实现了 3.1Hz 的极低推理帧率,支持分钟级长音频的实时高保真生成,不仅提升了处理效率,也在成本控制方面保持了业界领先水平。

蚂蚁集团在全模态大模型领域已深耕多年,Ming-Omni 系列经历了多次迭代,逐步完善了多模态处理能力。此次开源 Ming-Flash-Omni 2.0,标志着蚂蚁集团将核心能力以“可复用底座”的形式对外释放,为开发者提供统一的能力入口,助力构建端到端的多模态应用。这一举措不仅推动了技术共享,也为行业创新提供了坚实的基础。

蚂蚁开源Ming-Flash-Omni 2.0性能对标Gemini 2.5 Pro全模态大模型插图1

Ming-Flash-Omni 2.0 基于 Ling-2.0 架构(MoE,100B-A6B)进行训练,围绕“看得更准、听得更细、生成更稳”三大目标进行全面优化。在视觉处理方面,模型融合了亿级细粒度数据,并采用难例训练策略,显著提升了对近缘动植物、工艺细节和稀有文物等复杂对象的识别能力。这使得模型在处理高精度视觉任务时更加得心应手。

在音频处理方面,Ming-Flash-Omni 2.0 实现了语音、音效与音乐的同轨生成,支持用户通过自然语言对音色、语速、情绪等参数进行精细控制。同时,模型还具备零样本音色克隆与定制能力,能够快速适应不同声音需求,满足多样化的应用场景。这种强大的音频生成与控制能力,为内容创作和交互体验带来了全新可能。

在图像生成与编辑领域,Ming-Flash-Omni 2.0 通过增强复杂编辑的稳定性,支持光影调整、场景替换、人物姿态优化及一键修图等功能。即使在动态场景中,模型也能保持画面的连贯性与细节的真实性,为图像处理提供了更高的精度与效率。这些优化使得模型在实际应用中更加稳定可靠,能够应对各种复杂的图像生成需求。

目前,Ming-Flash-Omni 2.0 的模型权重与推理代码已在多个开源社区发布,用户可以自由下载和使用。同时,蚂蚁百灵官方平台 Ling Studio 也提供了在线体验与调用服务,方便开发者快速上手并探索模型的潜力。这一开源行动不仅促进了技术的普及,也为行业生态的构建注入了新的活力。

最新快讯

2026年02月11日

15:52
微新创想:2026年2月10日至23日,抖音生活服务在全国范围内推出“新春吃喝玩乐节”春节大促活动。此次活动不仅为用户带来丰富的优惠,还融入了多种互动玩法,提升节日氛围与参与感。 用户在活动期间的每日12点、17点、20点,可以登录抖音“团购”首页或直接搜索“春节团购”参与抢红包活动。通过抢红包,用户有机会领取餐饮、娱乐等领域的满减券,以及各类实物奖品,享受...
15:52
微新创想:2026年2月10日,德国知名硬件厂商Sharkoon旋刚正式发布了SKILLER SGK55W机械键盘。这款新品以其独特的设计和出色的性能,迅速吸引了众多键盘爱好者的关注。 SKILLER SGK55W采用75%紧凑配列,结合旋钮式设计,兼顾了便携性与功能性。用户可以根据自己的使用习惯,灵活调整键盘的布局,提升打字效率与操作体验。 在连接方式上,...
15:52
微新创想:2026年2月11日,T3出行面向全国符合条件的网约车司机推出新春保险福利。该福利免费提供为期一年的门急诊医疗、住院医疗及意外伤害保障,单人最高保额达15万元。 此举系继春节工会关怀与补贴后的新春专项举措,公司累计投入数千万元。保障覆盖全国注册并符合运营时长、服务评分等条件的T3平台司机,旨在提升司机职业安全感与权益保障水平。 此次保险福利的推出,...
15:52
微新创想:2026年2月10日,台积电董事会在日本熊本厂召开,正式审议通过了2025年度员工分红方案。该方案的总金额高达2061.46亿元新台币,约合455.38亿元人民币,创下了历史新高。此次分红覆盖了公司约7.8万名员工,人均可获得约264万元新台币,约合58.3万元人民币,相比上一年度增长了31.58%。这一显著提升反映了台积电在2025年整体经营状况...
15:52
微新创想:2026年2月10日,瑞典开发商Hazelight工作室宣布其下一款游戏已进入开发阶段。创始人Josef Fares当晚通过社交媒体确认该消息,并配发动捕现场合影。这一举动不仅展示了团队的辛勤付出,也引发了玩家对新作的广泛关注。 工作室官方推特以幽默方式暗示项目进展,借用《黑神话:钟馗》梗称“正在烹制美味食物”。这种轻松的表达方式让粉丝们对即将发布...
15:52
微新创想:2026年2月,北京瑞孚医药科技有限公司完成Pre-A轮融资,协同创新产业投资基金领投。此次融资标志着公司在小核酸药物研发领域获得重要认可,为其后续发展注入强劲动力。 该公司专注于小核酸药物的研发,是一家具有创新能力和技术实力的科技型中小企业。其核心技术基于碳环核苷修饰(cLNA)平台,这一平台在提升药物稳定性与递送效率方面展现出显著优势,为小核酸...
15:52
微新创想: 马年将至,一头牛的表情包反而先火出了圈。最近,不管是和朋友私聊,还是在群聊里,葡萄君总能见到这只皱着眉头的草地牛。它确实很魔性,该怎么形容呢……草地牛的眼神有种深邃、严肃、成熟的认真感,但身体却是治愈童风的奶牛造型。再加上和眼神毫不搭边的大鼻孔、情绪波动不明显的嘴角,整体结合出一种「态度很严肃,但其实也没在干什么很严肃的事」「严肃是表象,幽默是内...
15:52
微新创想:近日,杭州滨江区一家名为“假装上班无限公司”的机构引发了广泛关注。该机构提供一种独特的付费服务——每天支付30元,便可租用工位“上班”。这种服务模式看似矛盾,却在短短两个月内吸引了40余人参与。 令人意外的是,这种付费方式并非简单的摆拍或虚假行为,而是通过严格的规则来模拟真实职场环境。在这里,付费用户不仅要自掏腰包,还需严格遵守一系列纪律要求,包括...
15:52
微新创想:2月10日,一段萌娃与父亲的趣味约定视频在网络引发热议。视频中,孩子与父亲约定“网友点赞数等于跳绳数量”,不料“好心”网友集体发力,点赞数迅速突破180万大关。面对这一意外结果,父亲哭笑不得地表示:“有点懵,但会督促孩子每天跳300个,循序渐进完成目标。” 这一事件也引发关于“网络约定边界”的讨论。部分网友认为,家长的及时引导避免了“流量绑架”孩子...
15:52
微新创想:国产大模型再次迎来“硬核”升级 2026年2月11日科大讯飞官方宣布正式发布星火X2大模型 这款模型的发布不仅标志着通用能力的全面跃升更重要的是它是基于全国产算力底座训练而成实现了从底层算力到顶层应用的自主可控 聚焦高专业性拒绝“空谈”AI与单纯追求通用性的模型不同星火X2在实现基础能力升级的同时将重心放在了对专业性要求极高的四大核心领域 教育场景...
15:52
微新创想:一张照片不仅胜过千言万语还可能预示着你职业生涯的“身价” 一项最新的学术研究表明利用 AI 对照片进行性格分析可以预测个人在劳动力市场中的表现包括薪资水平和晋升路径 研究团队在一篇名为《AI 从面部提取性格:劳动力市场影响》的论文中指出他们分析了超过 9.6 万名 MBA 毕业生的 LinkedIn 头像 通过算法提取出“大五人格”特征(开放性...
15:52
微新创想:阿维塔车主们期待已久的大版本更新终于落地。2026年2月11日,阿维塔官方宣布正式向全系车型推送 AVATR.OS5.0.0 版本系统。本次升级的核心在于深度融合了 AI 大模型能力,并同步升级至华为最前沿的智驾系统。 微新创想:MoLA 大模型:车载助手的“进化时刻” 本次更新最引人注目的亮点是 MoLA 大模型助手 的正式上线。语义理解更精准:...