中国AI公司MiniMax最像Anthropic的真相

2025-12-23 12:08:14 互联网 2 次阅读

“中国的OpenAI”究竟是谁？媒体和分析机构普遍指向智谱，这家中国大模型AI创业公司正积极冲刺港交所IPO。招股说明书明确宣称：“2025年6月，智谱被美国OpenAI列为全球主要竞争对手。”毕竟，OpenAI引领了生成式人工智能的普及浪潮。任何投身大模型领域的企业，或多或少都会与OpenAI产生联系。最便捷的方式莫过于模仿OpenAI的成功模式，这或许是成为“中国的OpenAI”最直接的路径。那么，中国的Anthropic又是谁？表面上看，拥有自主基座模型、编程能力强、能整合基座模型与Agent能力、率先推出类似Computer Use功能的企业，才应被视为中国的Anthropic。但事实真的如此吗？Anthropic就是这样的存在吗？让我为你揭示一个颠覆认知的答案：MiniMax。MiniMax是另一家近期在港交所冲刺IPO的中国大模型AI公司。表面数据来看，MiniMax70%的收入来自C端用户，而Anthropic绝大多数收入源于B端；MiniMax拥有从语音到视频再到文本的全模态模型矩阵，Anthropic的Claude则专注于文本和编程，两者看似毫无关联。然而，它们实则惊人地相似。

“没有标签”是Anthropic与MiniMax最显著的共同点。创始人层面，Anthropic的Dario Amodei曾与几位OpenAI同事出走创业，源于对OpenAI商业化路线的不满。他们认为，在AI安全问题未彻底解决前，OpenAI将GPT-3交给微软使用，背离了技术理想主义初心。Dario Amodei在OpenAI担任研究副总裁，虽是技术主管，却并非聚光灯下的核心人物。他在获得生物物理学博士学位后，先在百度硅谷AI实验室工作，后加入Google从事语音识别，2016年才进入OpenAI。要给Dario Amodei贴标签十分困难：物理学博士？前OpenAI高管？AI安全专家？这些标签都部分准确，却都不够全面。2021年，闫俊杰从商汤离职创立MiniMax，同样担任副总裁、研究院副院长和智慧城市事业群CTO，也是技术主管出身，没有汤晓鸥式的创始人光环，甚至连“洋博士”都不是（中科院自动化所博士）。在罗永浩的对谈中，他坦言“我们是比较草根的团队，没啥背景”。这类技术主管出身的创业者，往往技术能力扎实，却缺乏领袖魅力训练，个人形象模糊，不擅长制造话题，更倾向于钻研技术细节，追求可解释性而非轰动效应。

让我们对比一下同期那些标签鲜明的创业者：OpenAI CEO Sam Altman，连续创业者，曾担任Y Combinator总裁，天生擅长聚光灯，擅长讲故事、制造声势，是硅谷人脉中枢，精通权力博弈。月之暗面（Kimi）创始人杨植麟，清华姚班本科，CMU博士，师从苹果AI负责人，30岁出头，“天才创业者”标签深入人心，还是摇滚乐手。就连Kimi的模型也自带“超长上下文”标签。但Dario Amodei和闫俊杰，很难用一句话概括其身份特质。他们在镜头前的表现平淡，语速缓慢，谈及技术时偶有激动，并不适合提炼“金句”。他们的公司业务也难以一言蔽之。MiniMax究竟是做什么的？视频生成？多模态？Agent？它都涉足，但每个产品都难以成为记忆点。技术上，M2曾位列开源模型排行榜第一，社区赞誉有加，但问及10位业内人士“MiniMax是做什么的”，答案必然五花八门。Anthropic同样如此。虽然很多人认为它专注于coding，但这与MiniMax做多模态的标签一样，看似精准实则片面。

Anthropic在编程领域的收入并不及企业API收入。它究竟是什么？Claude在C端的影响力远不及ChatGPT和Gemini，其本质难以被简单标签定义。“没有标签”在公众形象上是个挑战，但反过来看，这反而是它们最突出的标签。时间越长，“没有标签”的价值越凸显。因为，这正是当前大模型，特别是语言模型的发展趋势。模型能力正逐渐收敛，每家企业的优势都可能被竞争对手在数月内超越。Meta旗下的Llama曾备受瞩目，却被DeepSeek和Qwen迅速超越；两年前备受冷落的Google凭借Gemini3引发OpenAI警觉，成为全球模型之冠。DeepSeek和Google的优势能持续多久？无人知晓。在这种背景下，“没有标签”意味着人设不易崩塌，外界预期不会过高或过低，不会轻易被打脸，不会经历从云端跌落再反弹的过山车体验……“没有标签”，正逐渐成为安全感和确定性的来源。

看Claude，它经历过口碑的剧烈波动，但人们并未特别期待Claude5。无论是Claude4.5Sonnet还是Claude4.5Opus，用户依然踊跃使用，只是“炸裂”程度远不及Gemini3。MiniMax从01到M1再到M2，开源社区口碑一路攀升，OpenRouter数据显示其调用量超过许多更擅长社交媒体营销的开源模型。这是一种微妙而恰当的预期管理，对一家日益走向公众的公司尤为重要。在平衡损益表前，“进步”和“增长”是值得期待的，而“炸裂”和“翻车”则非如此。“没有标签”，反而应成为它们最重要的标签。

追求技术的可解释性2025年10月，MiniMax创始人和CEO闫俊杰在官方公众号发表技术长文《为什么MiniMax M2是一个Full Attention模型》。从text01到M1再到M2，MiniMax在模型预训练上经历了从线性注意力机制（Lightning Attention）回归全面注意力机制（Full Attention）的转变。团队发现线性注意力机制虽效果不错，但在复杂多跳推理任务中存在明显缺陷。随着模型与通用Agent功能趋近，“在Agent场景下，模型需要跨多个工具、跨上下文反复验证与调整。Hybrid Attention虽省算力，但易导致上下文信息缺失，造成逻辑中断”，闫俊杰在文章中坦诚了这一点，点明了M2回归Full Attention的原因。这种CEO公开承认技术试错的做法极为罕见。

这让我立刻联想到Anthropic CEO Dario Amodei今年4月在博客上发表的长文《The Urgency of Interpretability》（可解释性的紧迫性）。Amodei强调生成式AI的不透明问题，认为模型能力是“生长”而非“构建”的，与传统软件本质不同。这种不透明性导致AI安全和道德风险难以预测，因此迫切需要可解释性研究。重要的是，在这篇文章中，Amodei公开承认了他曾奉为圭臬的“Constitutional AI”（宪法式AI）的局限性。他认为Constitutional AI只能让模型“装作”遵循安全原则，内心可能另有想法。因此，Anthropic转向模型可解释性研究，目标是2027年用可解释性可靠检测大多数模型问题。这也是一次公开的技术路线试错。

无论是Amodei还是闫俊杰，他们撰写的解释文章都篇幅很长，技术细节丰富，作为公关素材并不适合提炼“金句”和标题，但对理解从事大模型基础研发公司的第一性原理至关重要。Amodei关于可解释性的长文本身就在追求技术可解释性。他之前针对DeepSeek崛起的万字长文也是，反传统地提出V3比R1更具挑战性的观点，详细剖析了两款模型的技术差异。MiniMax的掌舵者闫俊杰同样如此，他非常想向外界解释为何MiniMax回归Full Attention机制，认为这个问题必须讲清楚——其实外界未必关心，牛X就够了。但对这两位技术一线的CEO而言，写长文进行技术反思和解释意味着什么？意味着他们需要说服自己，而不仅仅是投资人和用户；意味着他们相信透明比神秘感更重要；意味着他们愿意承认“我们之前错了”，并公开技术探索过程。在快节奏的AI竞赛中，这是非常奢侈的。

你可以想象Sam Altman和Elon Musk在这种情形下会怎么做：直接发布新模型，用刷新benchmark的性能震撼用户，完全用结果说话，不解释技术路线问题，或轻描淡写，让副手解释。但毕竟有创始人和CEO愿意站出来，详细解释技术细节。追求技术的可解释性和透明性，会让公司在更长时间赢得客户信任。客户愿意看到一家大模型公司“笨”的一面，这比“神奇”更重要。

“笨架构”与“好商业”追求技术可解释性与大众传播似乎存在对立。Anthropic曾在旧金山机场密集投放Claude模型广告，强调其安全性，但数月后便消失。MiniMax也为旗下Talkie和海螺视频投放过X和YouTube广告，但并不持续。OpenAI可能不投广告，但Sam Altman在社交网络和访谈中的高强度非技术言论已足够。我曾看到一条YouTube节目开篇先后播放了两条广告——分别来自Gemini3和K2，你得承认YouTube算法推荐足够精准，也得承认真有人在拼命砸广告。在国内，豆包、千问……暂且不表。Anthropic和MiniMax属于一开始“定力不足”，试了就缩回来，想明白后不再大张旗鼓的类型。

MiniMax CEO闫俊杰对此有自己的解释。在访谈中，他说：“过去三年，AI创新的主阵地是Web，不是手机APP。国际上前十产品，除了中国的豆包，其他都是先做Web，靠自然量起来的。能靠不买量做起来的，只有Web端。”言下之意，就是MiniMax不靠买量做C端爆款，不靠炒作声量，专注技术迭代。在中国AI创业环境里，这是相当“笨”的做法。但这使得MiniMax可能是今天最重视可持续经营的模型公司之一，招股书披露其现金储备超11亿美元，足够支撑53个月运营。而目前5亿美元的亏损规模，其实不及一些C端大厂AI产品一年投流费用。

还有更“笨”的做法。2023年下半年，大部分中国AI公司还在做稠密模型，MiniMax将80%算力all-in到MoE上。投资人黄明明回忆：“前两次失败了，直到第三次成功，他（指闫俊杰）才跑来告诉我们。我问他为什么赌这么大？赌不出来公司就挂了。”闫俊杰的回答是：“只有做出MoE，才能用更低成本向更高阶段演进。否则用的是不可估量的成本，没有一家公司能支持”。MiniMax在技术架构探索上有着强烈执念：2023年到2024年上半年深耕MoE，控制模型演进成本；2024年下半年到2025年初探索线性注意力机制，启动开源战略；2025年中开始侧重推理优化与工程优化，回归全面注意力机制。至于它在跨模态领域展现的模型能力——从语音（Speech-02-HD）和视频（Hailuo-02）领域的顶尖水平，到如今M2在文本和代码领域的突破，实则是基于基础架构持续探索与适配下打磨的一整套瑞士军刀。

实在不是牵强附会，MiniMax基于第一性原理（成本与性能平衡）的架构探索，与Anthropic的技术路径摸索有很多相似之处。2021-2023年，Anthropic侧重单一“安全”维度，2023年3月才发布第一代“安全”模型；2024年，通过Claude3家族迅速建立与GPT-4竞争能力，突破“安全”桎梏，在产品化上大刀阔斧；2024年底，将Agent与模型推理能力视作战略重心，先是MCP，再是Skill，成为AI Agent标准建立者。甚至基于Agent需求，探索从Constitutional AI向可解释性AI原理的基础技术转变。不同于MiniMax将架构思考渗透到不同模态产品中，Anthropic对多模态没有执念，其“瑞士军刀”是Claude模型的Haiku、Sonnet和Opus三个不同性能版本，相当于每一代瑞士军刀的三件套。这些对普通用户可能无感，但对AI研究人员却很有意义，尤其是企业级开发者，他们很容易找到所需工具和API。

接受访谈时，闫俊杰说：“技术驱动和产品驱动，两者可能都对，但没法共存。它的驱动力只能有一个。后面我们开始意识到，有可能那样一条路（产品驱动）也是对的，但它不适合我们。我们能做的，就只能是技术驱动。”潜台词是：他们曾纠结过，最终选择了技术驱动，知道会失去一些东西（如快速用户增长），但这唯一适合他们的路。这么做的结果是什么？真的是要忍受漫长的消费级市场默默无闻，等待5年甚至10年后的“效果涌现”吗？我们看看它们的商业化数据。2024年，Anthropic收入仅10亿美元；2025年仅3-5月，其营收规模就从20亿美元增长到30亿美元，Meritech分析师Alex Clayton表示：“我们研究了200多家上市软件公司IPO，这种增长速度从未发生过”。2025年上半年，Anthropic研发投入与营收比约为1.04:1，基本持平，在尚处军备竞赛阶段的AI产业已相当令人羡慕。它明显比OpenAI对应的1.56:1健康得多。

受限于资本投入、算力和市场规模，MiniMax自然无法与Anthropic全面相提并论，但《The Information》报道，MiniMax是目前亚洲唯一被证实拥有规模化全球收入的大模型公司——这些收入来自可持续、可规模化的产品（C端的海螺视频、Talkie，B端的API订阅），而非资本输血或薄利项目。MiniMax在招股说明书中披露的经过审计的营收数据更严格：2023年开始商业化，营收达346万美元；2024年飙升到3052万美元，同比增长782.2%；2025年前9个月，营收同比增长175%，达到5344万美元，已远超去年全年水平。截至2025年9月30日，C端收入同比增长181%，B端收入同比增长160%。毫无疑问，它呈现了一条极具想象力的营收曲线。而最能体现大模型实际调用量的OpenRouter数据显示，MiniMax M2是首个日token消耗量超500亿的中国模型，免费版加付费版日调用量超800亿，跻身Top10（分列第4和第7），用量高速增长。这意味着，向Anthropic一样靠卖API赚钱，接收企业信用卡收入；通过Stripe收取个人用户收入，而非承接大型部署项目，开具一两年后才兑换的企业支票，在MiniMax正在成为现实。此次招股书披露的关键数据显示，MiniMaxB端业务毛利率达69.4%，显著高于同行；整体毛利也从2023年的-24.7%快速转正，2024年为12.2%，2025年前九个月更是达到23.3%。

2014年，Anthropic CEO Dario Amodei还在百度实习时，就发现了Scaling Law（缩放定律）——大语言模型的核心原理。当时同样在百度实习、做深度学习实验的闫俊杰也在中科院自动化所读博士。闫俊杰回忆：“那时国内没有万卡，但那是唯一一个真正意义上的GPU集群。我用可能三分之一的GPU做实验。我开始意识到，AI这件事真的可以带来实际价值，而不只是写论文。”然而，中国错失了GPT-3.5的时间窗口，而Scaling Law其实是在2014年在中国发现的。亡羊补牢，有时确实太晚。接下来，是跳跃式发展，还是遵循内心和“第一性”？不同的人有不同的答案。有趣的是，Anthropic和MiniMax，这两个看似最不像的，甚至在地缘意义上处于某种微妙对立的公司，却选择了非常接近的答案。