
最近一个月,人工智能基础模型领域似乎涌现出不少新面孔。但深入观察各大厂商的动向,可以发现它们主要走了两条发展路径。一种是在技术难点中聚焦突破,成为某个单一领域的SOTA(State-of-the-Art)解决方案。这种策略能快速在开发者群体中建立鲜明印象,但也可能限制公司技术平台的扩展性。另一种则是全面布局,在构建最完善的基础模型框架中逐步攻克各个关键领域。全球顶尖的语音模型和视频模型开发商MiniMax就属于后者,而它最新推出的MiniMax M2模型,正是这一路线的又一力作。
10月28日,MiniMax正式发布了新一代基础模型MiniMax M2。根据官方介绍,这款模型专为编程和智能体(agent)应用设计,同时兼顾轻量化和高响应速度。除了在通用能力上的针对性优化,M2保持了200k的上下文窗口大小(最大输入token+输出token总和),最大输出长度可达128k token。更值得关注的是,它提供了端到端的工具级API支持,官方将其定义为”兼具极致性价比和卓越性能的智能解决方案”。
值得注意的是,这款2300亿参数规模的模型采用了创新的参数激活控制技术,实际激活参数仅100亿。在权威的Artificial Analysis榜单(覆盖数学、科学和编程等多个核心领域)中,M2的综合评分已跻身全球前五。这意味着MiniMax在强化编程和智能体能力的同时,并未牺牲模型的通用性能。更关键的是,这一切突破都伴随着显著的价格优势。MiniMax宣称,在某些任务上的成本仅为Claude的8%。目前,M2的API定价为每百万输入token 0.3美元/2.1元人民币,输出token 1.2美元/8.4元人民币,同时提供每秒100token的推理服务,且该速度仍在持续优化中,使其成为兼具价格和性能优势的模型选择。

为配合新模型推广,MiniMax宣布延长免费测试时间至11月6日,期间用户可免费使用M2的全部功能。官方在宣传中特别提到:”我们将免费提供MiniMax Agent,直到服务器被我们自己的测试用户挤爆为止。”这一策略取得了显著成效,限时免费期间开发者调用量激增,M2已跻身OpenRouter平台调用量排名前十。
如此出色的成本控制得益于技术创新与工程实力的双重突破。此次发布同时,MiniMax还推出了升级版的Agent应用,安卓和iOS版本同步上线。这种”模型即产品”的发布策略与OpenAI发布Sora2时的理念类似——当模型能力与工程实现紧密结合时,用户能直接体验到技术进步带来的产品价值。这些变化不再是论文中的理论表述,而是转化为可感知的产品能力,为其他模型能力的融合提供了统一出口。
实测结果令人印象深刻。我们通过四组测试全面评估了M2的实际表现:文章创作速度、编程能力、端到端开发流程以及网页交互功能。
测试A:速度对比
我们让M2和Claude4.1同时创作《AI智能体的未来》主题文章(约800字)。要求仅测试速度,M2几乎是秒出完整内容,而Claude还在分段生成时,M2已完成了四段。令人惊喜的是,M2的输出不仅速度快,内容结构和语言表达都十分流畅自然,给人一种”输入即输出”的流畅体验。

测试B:编程能力
我们采用经典的Gilded Rose重构测试案例,该项目包含一个商品管理系统,需要在不影响原有功能的前提下添加新商品”Conjured”并实现特殊品质衰减规则。M2首先自动识别出项目语言(Python),然后解析五种商品类型(普通商品、Aged Brie、Sulfuras、Backstage Passes、Conjured)及其逻辑关系。它发现原始代码存在条件分支复杂、逻辑重复等问题,提出采用策略模式重构的解决方案。在实现过程中,M2同步修改测试脚本和示例文件,确保新架构与原有系统兼容。当首次测试出现断言失败时,M2能自动分析错误日志定位问题,经过几轮迭代最终通过所有测试。整个过程展现了标准工程师的工作流程:分析→重构→实现→调试→验证,体现了清晰的架构意识和问题解决能力。
测试C:端到端开发
我们仅提供空的calc.py和test_calc.py文件,要求实现加法、除法功能并处理除零异常。M2先分析测试需求,然后编写代码,首次运行测试失败后能立即定位并修复问题,整个过程不到一分钟。这相当于让模型独立完成从需求分析到测试通过的完整开发流程。
测试D:网页交互
我们采用”受控指令”方式测试M2的three.js编程能力,要求实现太阳系三维场景(含行星自转公转、轨道线、控制面板等)。首次生成中,M2完成了除行星大小控制外的所有功能。通过对话引导,M2在第二次尝试中成功修复了该问题。运行日志显示,M2的工作过程呈现”生成→验证→修复”的典型工程循环:先构建完整场景,发现缩放问题时逐层排查,最终采用安全方案实现功能。这表明模型不仅会生成代码,还具备一定的调试优化能力。
MiniMax的技术路线颇具特色。在Agent成为技术演进热点的同时,关于”模型即Agent”的争论持续不断。MiniMax M2的出现为这一讨论提供了新视角——在各模态模型上达到SOTA水平的企业,或许更能将Agent能力普惠化。目前,MiniMax的语音模型Speech-02-HD和视频模型Hailuo02均保持全球领先水平:Speech-02-HD采用创新的Flow-VAE架构,Hailuo02升级使用NCR架构提升复杂场景理解能力。MiniMax的技术追求与众不同——他们更愿意投入时间打磨底层技术,解决实际应用中的真问题。

从年初开源的MiniMax01系列到M1,再到今天的M2,MiniMax的技术演进路径清晰可见:线性注意力机制→强化学习技巧CISPO→Agent专用优化。M2正是MiniMax构建”充裕智能”蓝图的又一重要环节,它既是模型,也是应用,代表了公司在多模态智能融合方面的最新进展。与其他公司不同,MiniMax坚持在各个重要模态上自主研发模型训练方法,并逐步获得实际收益。这种全方位能力掌控能力,或许正是MiniMax与其他玩家的最大区别。
未来,MiniMax将继续按照自己的节奏,在多模态智能领域持续突破。我们期待看到拥有语音、视频、文本等强大模型的MiniMax,如何将它们融合为更智能的应用体验。这可能是下一个技术突破的来源。目前,MiniMax M2可通过Agent APP、API及各大模型平台使用,且官方宣布全球限时免费14天,欢迎开发者体验。
