MiniMax M2.5开源发布 低成本Agent时代全面开启

微新创想:MiniMax 发布 M2.5 模型,这是其 M2 系列在 108 天内的第三个版本。该模型不仅开源权重同步上线魔搭 ModelScope,更在能力、效率、成本三个方面实现了突破性进展。M2.5 在编程、搜索、办公等多个应用场景中表现出色,为用户提供了从零代码使用到私有化部署的全流程接入方案。此外,MiniMax 还推出了工具调用与推理参数调优的完整实战指南,推动低成本 Agent 时代的到来。

微新创想:M2.5 在多项权威评测中取得了优异成绩。SWE-Bench Verified 得分达到 80.2%,超越了 GPT-5.2 并接近 Claude Opus4.5。在 Multi-SWE-Bench 测试中,M2.5 以 51.3% 的表现位居多语言编程能力行业第一。BrowseComp 得分高达 76.3%,在搜索与工具调用能力方面大幅领先。编程能力方面,M2.5 展现出架构师级别的规划能力,覆盖完整的开发生命周期,支持多平台全栈开发,其框架泛化能力优于 Claude Opus4.6。搜索任务中,模型能够减少 20% 的轮次消耗,专家级搜索表现卓越。办公场景中,M2.5 融合了金融、法律等行业知识,展现出高阶办公能力,内部评测显示其对主流模型的胜率高达 59.0%。

MiniMax M2.5开源发布 低成本Agent时代全面开启插图1

微新创想:M2.5 在性能上也有显著提升,其速度较 M2.1 提高了 37%,与 Claude Opus4.6 的耗时持平,但成本仅为后者十分之一。这一突破性的表现得益于 MiniMax 在技术创新方面的持续投入。M2.5 的快速迭代主要源于三大核心技术的创新:一是 Forge 原生 Agent RL 框架,实现了约 40 倍的训练加速;二是 CISPO 算法保障大规模训练的稳定性,有效解决了长上下文信用分配难题;三是创新的 Reward 设计,能够在模型效果与响应速度之间取得良好平衡。这些技术的融合使得 MiniMax 内部 30% 的日常任务和 80% 的新提交代码得以由 M2.5 完成,M2 系列在 108 天内 SWE-Bench Verified 得分从 69.4% 飙升至 80.2%,迭代速度远超行业主流模型。

微新创想:为了满足不同用户的需求,M2.5 提供了多种部署方式,包括零代码使用、API 调用和本地部署。非技术用户可以通过 MiniMax Agent 网页端轻松上手,平台已有超过 10000 个用户创建了可复用的 “Expert” 工具。开发者可以选择调用魔搭免费 API 或官方 API,官方还推出了 Lightning 和标准版两个 API 版本,成本仅为同类模型的十分之一到 twentieth。本地部署方面,M2.5 支持 SGLang、vLLM、Transformers、MLX 四种方案,分别适用于高并发生产、中小规模生产、快速验证和 Mac 本地开发等不同场景,并提供了各方案的硬件要求和详细操作步骤。

微新创想:M2.5 还原生支持结构化工具调用,能够并行调用多个工具。通过 vLLM 或 SGLang 部署,用户可以直接使用 OpenAI SDK 格式进行调用,而其他框架则需要手动解析 XML 格式输出。同时,官方提供了工具结果回传模型的完整流程和最佳实践,帮助用户更高效地实现自动化任务。在推理参数方面,官方推荐使用 temperature=1.0、top_p=0.95、top_k=40 的配置,以达到最佳效果。不同场景下,用户可以根据需求灵活调优参数。此外,M2.5 对 10 多种编程语言和多种脚手架均具备优秀的适配性,使得编程提示词能够充分利用模型的架构师思维,提升开发效率与质量。

最新快讯

2026年02月14日

16:53
微新创想:2月14日消息,除夕的烟花尚未绽放,AI战场早已硝烟弥漫。2026年马年春节,表面上是百度5亿、腾讯元宝10亿红包、阿里30亿免单的混战,实则是国产大模型阵营一次史无前例的“集体亮剑”。从腊月二十开始,字节、智谱、MiniMax、Kimi扔出王炸,DeepSeek悄无声息地完成了关键迭代,阿里Qwen3.5箭在弦上,百度O计划秘而不宣,腾讯则请来姚...
16:53
微新创想 近日,广东佛山禅城区一家餐饮店的老板吴先生在网上发布求助信息,称有一位顾客在五年内累计点了2000多次外卖,相当于每天至少点一次。然而,去年这位顾客突然消失,再未下单。吴先生猜测这位顾客可能搬家了或者换了工作,希望可以联系到他,报个平安。 吴先生的店里特意留了一把贴有“外卖老友专座”标签的椅子,以示对这位忠实顾客的重视和欢迎。他表示,曾经尝试通...
16:53
微新创想 今日,小米智能生态官微正式宣布,米家洗衣机将陆续推送OTA升级,带来多项全新功能,包括米家灵云智烘、疾速烘、洗烘联动3.0、30水温调节等,进一步提升用户的使用体验。此次升级将覆盖多款在售机型,为不同需求的用户带来更智能、更高效的洗衣解决方案。 微新创想 其中,米家灵云智烘功能将根据天气温湿度、空气指数等环境因素,智能调节烘干参数,为衣物提供更加贴...
16:53
微新创想 日前,科大讯飞召开年会,董事长刘庆峰与总裁吴晓如分别发表演讲,全面回顾2025年的经营成果,并明确2026年的战略方向与关键行动。在年会现场,吴晓如透露了多项重要数据,2025年公司经营回款超过270亿元,经营性现金流再创新高,达到30亿元,同比增长28%。同时,公司整体规模利润同比增长40%至70%,展现出强劲的增长势头。 在产品层面,科大讯飞的...
16:53
微新创想 字节跳动推出的新型AI影像工具Seedance 2.0近日遭到好莱坞主要制片厂的强烈谴责。这款工具能够通过简单的文本提示生成超现实高仿真影像,迅速在社交平台上走红。用户只需输入文本指令,就能制作出如汤姆克鲁斯与布拉德皮特在屋顶打斗的逼真画面。然而,这一功能也引发了严重的版权侵权担忧,使Seedance 2.0成为行业争议的焦点。 微新创想 Seed...
16:53
微新创想:近日显卡硬件识别工具GPU-Z迎来了重要版本更新,版本号为v2.69.0。此次更新不仅带来了多项功能优化,还新增了对多款新显卡的支持,为用户提供了更全面的硬件检测体验 此次更新中,最令人关注的是GPU-Z正式支持摩尔线程MTT S30显卡。这款入门级产品在规格上大致相当于MTT S80的四分之一,搭载了1024个MUSA架构核心,核心频率达到1.3...
16:48
微新创想:2月13日,劳斯莱斯在迪拜推出了一款名为幻影Arabesque的定制版车型。这款特别版车型由劳斯莱斯迪拜“私人办公室”精心打造,标志着品牌在定制化领域迈出了重要的一步。作为劳斯莱斯品牌历史上首款采用激光雕刻引擎盖的车型,其雕刻深度仅为145–190微米,展现了极高的工艺水准。这项技术历经五年研发才得以实现,体现了劳斯莱斯对细节的极致追求。 车身设计...
16:48
微新创想:2月14日,淘宝闪购联合旅途易购上线“高铁站点餐”服务。该服务面向全国高铁旅客,用户通过淘宝或支付宝APP,将收货地址设为指定高铁站,即可在专属频道选购餐食、饮品及伴手礼等商品。 微新创想:到站后凭订单至站内合作店铺或取货点自提,极大便利了旅客的用餐体验。杭州东站、杭州西站、宁波站作为首批试点站点,已接入30余家品牌商户,涵盖各类热门食品和特色礼品...
16:48
微新创想:2026年2月14日15时15分 郑州市气象台发布大风蓝色预警信号 预计当晚至次日 郑州市主城区 航空港区 上街区所辖乡镇及街道将出现4—5级偏北风 阵风7级左右 局地可达9级以上 此次大风主要受冷空气南下影响 持续时间约24小时 相关部门已提醒公众关好门窗 加固临时搭建物 避免在广告牌 大树下逗留 防范高空坠物和电力设施隐患
16:48
微新创想:2026年2月14日,春运期间长三角地区直升机低空航线迎来出行高峰。随着春节临近,大量旅客选择通过直升机方式快速往返,以避开地面交通拥堵。上海浦东至江苏南通老港码头航线单程仅需30余分钟,较地面交通缩短约70%。该航线由多家通航企业联合运营,航班频次稳定,上客率高,已实现常态化起降。 微新创想:目前以上海为中心,覆盖江苏、浙江、安徽多地的低空航线网...
16:48
微新创想:2026年2月14日,工信部等五部门联合印发《茶产业提质升级指导意见(2026—2030年)》。该文件为未来五年中国茶产业的发展指明了方向,提出了明确的目标和措施。 文件明确指出,到2028年,将培育5个以上年营业收入超100亿元的茶产业集群。同时,扶持一批营收超50亿元的茶全产业链龙头企业,推动其成为具有国际影响力的品牌。这一目标旨在通过规模化发...
16:48
微新创想:2026年2月14日,工信部等三部门联合印发《酿酒产业提质升级指导意见(2026—2030年)》,明确提出推动白酒、黄酒等中式酒品与中式美食实现“酒餐融合协同出海”。该文件强调,要通过加强国内外标准的对比研究,制定符合国际通行的分级分类和检测标准,提升中国酒类产品的国际认可度。 微新创想:同时,政策鼓励酿酒企业依法合规地开展海外原料基地、酒庄、包装...