OpenBMB 团队近日传来振奋人心的消息,宣布新一代多模态大模型 MiniCPM-V4.0 正式开源发布。这款模型凭借其轻量级架构与卓越性能,被业界誉为”手机上的 GPT-4V”,有望为移动设备上的 AI 应用带来革命性的突破,开启智能交互体验的新纪元。

MiniCPM-V4.0的核心魅力在于其精巧的设计理念。该模型基于 SigLIP2-400M 和 MiniCPM4-3B 融合构建,参数量仅为 4.1B,却在图像、多图像和视频理解方面展现出惊人的能力。它不仅能轻松处理单张图片,更能理解复杂的多图关联内容和视频片段,为用户带来前所未有的智能交互体验。

尽管参数量相对较小,MiniCPM-V4.0 的性能表现却令人叹为观止。在权威的 OpenCompass 八大主流评测基准上,该模型平均得分高达 69.0,不仅超越了 GPT-4.1-mini 和 Qwen2.5-VL-3B 等强劲对手,更在视觉理解方面展现出超凡实力。特别是在处理复杂场景时,其准确性和深度分析能力令人印象深刻,充分证明了其在多模态领域的领先地位。

MiniCPM-V4.0 的另一大突破性优势是专为移动设备进行的高度优化。在最新的 iPhone16Pro Max 上的实测显示,该模型首次响应延迟不到 2秒,解码速度超过 17token/秒,同时在运行时能有效控制设备发热,确保了极致流畅稳定的用户体验。此外,它还能处理高并发请求,非常适合在手机、平板电脑等边缘设备上的实际应用场景。

为了降低开发者的使用门槛,OpenBMB 团队提供了全方位的生态支持。MiniCPM-V4.0 兼容 llama.cpp、Ollama 和 vllm_project 等主流框架,为开发者提供了灵活多样的部署选择。团队还特别开发了 iOS 应用,支持在 iPhone 和 iPad 上直接运行,并发布了详细的 Cookbook,提供完整的教程和代码示例,让开发者能够轻松上手。

MiniCPM-V4.0 的应用场景极为广泛,主要包括:图像分析与多轮对话——用户可上传图片,让模型进行内容分析,并在此基础上进行连续对话;视频理解——能够深度分析视频内容,为需要处理视频信息的场景提供专业解决方案;OCR 与数学推理——模型具备识别图片中文字和解决数学问题的能力,极大提升了其实际工作和学习中的实用性。

MiniCPM-V4.0 的开源发布,不仅彰显了国内 AI 团队在轻量级模型研发上的卓越实力,更为全球开发者提供了探索移动端多模态技术的强大工具,为 AI 普惠化迈出了坚实的一步。这一突破性成果将推动多模态技术在移动设备上的广泛应用,开启智能生活的新篇章。

Github:https://github.com/OpenBMB/MiniCPM-oHugging Face:https://huggingface.co/openbmb/MiniCPM-V-4ModelScope:https://modelscope.cn/models/OpenBMB/MiniCPM-V-4CookBook:https://github.com/OpenSQZ/MiniCPM-V-CookBook

最新快讯

2025年08月07日

12:13
近日,河南驻马店发生了一起令人痛心的家庭赡养纠纷,引发社会广泛关注。钱女士向媒体倾诉,自己年逾七旬的母亲育有两子三女,本应享受儿孙绕膝的晚年幸福,却因三年前选择再婚,遭到大儿子的无情拒绝赡养。据悉,钱女士的母亲在父亲去世后独自生活多年,为了晚年有个依靠并减轻子女负担,老人做出了再婚的决定。然而,这一选择却在大儿子心中掀起巨浪,他认为母亲再婚"有失脸面",甚至...
12:13
随着大语言模型(LLM)和视觉-语言模型(VLM)的迅猛发展,智能体在知识发现与问题解决领域的变革正以前所未有的速度推进。然而当前众多开源智能体框架普遍存在过度依赖昂贵付费工具的问题,这极大制约了其可复现性和广泛应用前景。为突破这一瓶颈,腾讯 AI Lab 隆重推出全新开源智能体框架——Cognitive Kernel-Pro,该框架致力于最大限度降低外部依...
12:13
微软近期重磅发布一项创新举措,宣布通过其先进的 Windows AI Foundry 平台,向广大 Windows 11 用户免费开放 OpenAI 最新推出的开源大模型 gpt-oss-20b。这一举措标志着 AI 技术的又一次重大突破,用户无需借助云端服务,即可在本地设备上直接体验强大的 AI 功能,并灵活调用各类热门开源模型。 gpt-oss-20b ...
12:13
谷歌与Kaggle联合举办的首届AI国际象棋对战赛事近日引爆全球关注。这场顶尖智能的巅峰对决中,由马斯克旗下Grok AI开发的Grok4模型表现惊艳,以绝对优势成为首日比赛的焦点人物。这场高手云集的赛事汇聚了包括OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2Instruct、Gemini2.5Pro、Gemini2.5Flash...
12:13
8月5日至6日,中国有色金属工业协会锂业分会会长李宇圣率领团队深入江西宜春,对当地锂产业龙头企业展开专项调研,重点考察锂云母提锂技术的最新发展与应用情况。作为我国锂资源战略储备的核心区域,宜春在保障国家能源安全、推动锂产业链升级方面扮演着关键角色。此次调研旨在全面掌握锂云母提锂产业的技术瓶颈、市场动态及未来发展趋势,为行业政策制定提供科学依据。 锂云母提锂技...
12:13
2025年8月7日,中国广核集团旗下科技创新企业中广核贝谷科技有限公司与行业领军安防企业海康威视正式达成战略合作,共同开启智慧安检技术领域的深度合作新篇章。此次合作将聚焦于全国范围内的智慧安检技术研发与应用推广,通过双方在技术、资源及市场渠道上的全面协同,加速相关技术的创新落地与场景化应用。作为智慧安防领域的两大重要参与者,中广核贝谷与海康威视此次携手,不仅...
12:13
随着"即买即饮"消费模式的蓬勃兴起,各大酒企正积极抢占即时零售这一新兴赛道。最新数据显示,去年上半年美团闪购平台上白酒交易额实现了100%的惊人增长,而今年"618"期间,酒类商品成交额更是较去年同期激增超过18倍。这种模式通过高效的即时配送体系,精准满足了年轻消费群体对便捷、即时消费体验的需求,同时也显著提升了酒企的库存周转效率。 尽管市场前景广阔,但...
12:13
2025年8月7日,知名经济学家马光远在其个人微博上公开反映,自己佩戴的佳明运动手表存在心率监测不准确的问题,同时指出该产品的质保期限仅为一年,这一情况迅速引发了社会各界的广泛关注。马光远在推文中明确表达了对这一质保期限的质疑,认为以数千元的高昂价格出售的运动手表,其仅提供一年的质保服务明显不合理,并呼吁广大消费者能够就此问题展开深入讨论,共同维护自身权益。...
12:13
2025年8月7日,资深财经评论员李大霄在其最新市场分析中释放出重要信号,尽管近期股市呈现“快牛”态势,但指数冲击万点大关的目标仍遥不可及。李大霄强调,当前市场情绪虽有所回暖,部分板块如科技、新能源等展现出强劲上涨动力,但整体经济复苏基础尚不稳固,企业盈利增长也未能同步跟上。这种结构性分化反映出市场内部矛盾,使得高位运行的风险显著增加。他特别提醒投资者,在当...
12:13
2024年,湖南裕能的核心管理层经历了一次显著的薪酬调整。公司财务总监王洁的年薪从上年的175.5万元锐减至104.52万元,降幅高达71万元,即40.45%的降幅。现年55岁的王洁拥有大专学历,是磷酸铁锂行业的领军企业湖南裕能的关键管理人员之一。尽管公司当年实现了225.99亿元的营收,但净利润却出现了惊人的62%暴跌,这一现象凸显了行业寒冬下“规模诅咒”...
12:13
近日,金山办公重磅推出全新一代原生Office办公智能体——WPS灵犀,这款智能助手深度集成于WPS Office组件体系之中,为用户带来前所未有的同屏双屏办公新体验。WPS灵犀左侧呈现办公套件,右侧实时响应智能交互,让工作流程更加流畅高效。 作为WPS Office的核心创新成果,WPS灵犀创新性地接入豆包大模型与火山引擎问答Agent两大尖端技术平台,全...
12:13
2025年8月7日上午,A股市场资金流向呈现明显分化态势,主力资金显著活跃于多个板块。其中,电子行业表现亮眼,主力资金净流入高达12.48亿元,成为市场热点之一。食品饮料板块同样备受青睐,净流入规模达10.38亿元,显示出投资者对消费领域的持续关注。交通运输板块也获得主力资金积极布局,净流入额为9.14亿元,反映出市场对基建投资和物流运输的看好。 与此同时,...