中国AI公司MiniMax最像Anthropic的真相

“中国的OpenAI”究竟是谁?媒体和分析机构普遍指向智谱,这家中国大模型AI创业公司正积极冲刺港交所IPO。招股说明书明确宣称:“2025年6月,智谱被美国OpenAI列为全球主要竞争对手。”毕竟,OpenAI引领了生成式人工智能的普及浪潮。任何投身大模型领域的企业,或多或少都会与OpenAI产生联系。最便捷的方式莫过于模仿OpenAI的成功模式,这或许是成为“中国的OpenAI”最直接的路径。那么,中国的Anthropic又是谁?表面上看,拥有自主基座模型、编程能力强、能整合基座模型与Agent能力、率先推出类似Computer Use功能的企业,才应被视为中国的Anthropic。但事实真的如此吗?Anthropic就是这样的存在吗?让我为你揭示一个颠覆认知的答案:MiniMax。MiniMax是另一家近期在港交所冲刺IPO的中国大模型AI公司。表面数据来看,MiniMax70%的收入来自C端用户,而Anthropic绝大多数收入源于B端;MiniMax拥有从语音到视频再到文本的全模态模型矩阵,Anthropic的Claude则专注于文本和编程,两者看似毫无关联。然而,它们实则惊人地相似。

“没有标签”是Anthropic与MiniMax最显著的共同点。创始人层面,Anthropic的Dario Amodei曾与几位OpenAI同事出走创业,源于对OpenAI商业化路线的不满。他们认为,在AI安全问题未彻底解决前,OpenAI将GPT-3交给微软使用,背离了技术理想主义初心。Dario Amodei在OpenAI担任研究副总裁,虽是技术主管,却并非聚光灯下的核心人物。他在获得生物物理学博士学位后,先在百度硅谷AI实验室工作,后加入Google从事语音识别,2016年才进入OpenAI。要给Dario Amodei贴标签十分困难:物理学博士?前OpenAI高管?AI安全专家?这些标签都部分准确,却都不够全面。2021年,闫俊杰从商汤离职创立MiniMax,同样担任副总裁、研究院副院长和智慧城市事业群CTO,也是技术主管出身,没有汤晓鸥式的创始人光环,甚至连“洋博士”都不是(中科院自动化所博士)。在罗永浩的对谈中,他坦言“我们是比较草根的团队,没啥背景”。这类技术主管出身的创业者,往往技术能力扎实,却缺乏领袖魅力训练,个人形象模糊,不擅长制造话题,更倾向于钻研技术细节,追求可解释性而非轰动效应。

让我们对比一下同期那些标签鲜明的创业者:OpenAI CEO Sam Altman,连续创业者,曾担任Y Combinator总裁,天生擅长聚光灯,擅长讲故事、制造声势,是硅谷人脉中枢,精通权力博弈。月之暗面(Kimi)创始人杨植麟,清华姚班本科,CMU博士,师从苹果AI负责人,30岁出头,“天才创业者”标签深入人心,还是摇滚乐手。就连Kimi的模型也自带“超长上下文”标签。但Dario Amodei和闫俊杰,很难用一句话概括其身份特质。他们在镜头前的表现平淡,语速缓慢,谈及技术时偶有激动,并不适合提炼“金句”。他们的公司业务也难以一言蔽之。MiniMax究竟是做什么的?视频生成?多模态?Agent?它都涉足,但每个产品都难以成为记忆点。技术上,M2曾位列开源模型排行榜第一,社区赞誉有加,但问及10位业内人士“MiniMax是做什么的”,答案必然五花八门。Anthropic同样如此。虽然很多人认为它专注于coding,但这与MiniMax做多模态的标签一样,看似精准实则片面。

Anthropic在编程领域的收入并不及企业API收入。它究竟是什么?Claude在C端的影响力远不及ChatGPT和Gemini,其本质难以被简单标签定义。“没有标签”在公众形象上是个挑战,但反过来看,这反而是它们最突出的标签。时间越长,“没有标签”的价值越凸显。因为,这正是当前大模型,特别是语言模型的发展趋势。模型能力正逐渐收敛,每家企业的优势都可能被竞争对手在数月内超越。Meta旗下的Llama曾备受瞩目,却被DeepSeek和Qwen迅速超越;两年前备受冷落的Google凭借Gemini3引发OpenAI警觉,成为全球模型之冠。DeepSeek和Google的优势能持续多久?无人知晓。在这种背景下,“没有标签”意味着人设不易崩塌,外界预期不会过高或过低,不会轻易被打脸,不会经历从云端跌落再反弹的过山车体验……“没有标签”,正逐渐成为安全感和确定性的来源。

看Claude,它经历过口碑的剧烈波动,但人们并未特别期待Claude5。无论是Claude4.5Sonnet还是Claude4.5Opus,用户依然踊跃使用,只是“炸裂”程度远不及Gemini3。MiniMax从01到M1再到M2,开源社区口碑一路攀升,OpenRouter数据显示其调用量超过许多更擅长社交媒体营销的开源模型。这是一种微妙而恰当的预期管理,对一家日益走向公众的公司尤为重要。在平衡损益表前,“进步”和“增长”是值得期待的,而“炸裂”和“翻车”则非如此。“没有标签”,反而应成为它们最重要的标签。

追求技术的可解释性2025年10月,MiniMax创始人和CEO闫俊杰在官方公众号发表技术长文《为什么MiniMax M2是一个Full Attention模型》。从text01到M1再到M2,MiniMax在模型预训练上经历了从线性注意力机制(Lightning Attention)回归全面注意力机制(Full Attention)的转变。团队发现线性注意力机制虽效果不错,但在复杂多跳推理任务中存在明显缺陷。随着模型与通用Agent功能趋近,“在Agent场景下,模型需要跨多个工具、跨上下文反复验证与调整。Hybrid Attention虽省算力,但易导致上下文信息缺失,造成逻辑中断”,闫俊杰在文章中坦诚了这一点,点明了M2回归Full Attention的原因。这种CEO公开承认技术试错的做法极为罕见。

这让我立刻联想到Anthropic CEO Dario Amodei今年4月在博客上发表的长文《The Urgency of Interpretability》(可解释性的紧迫性)。Amodei强调生成式AI的不透明问题,认为模型能力是“生长”而非“构建”的,与传统软件本质不同。这种不透明性导致AI安全和道德风险难以预测,因此迫切需要可解释性研究。重要的是,在这篇文章中,Amodei公开承认了他曾奉为圭臬的“Constitutional AI”(宪法式AI)的局限性。他认为Constitutional AI只能让模型“装作”遵循安全原则,内心可能另有想法。因此,Anthropic转向模型可解释性研究,目标是2027年用可解释性可靠检测大多数模型问题。这也是一次公开的技术路线试错。

无论是Amodei还是闫俊杰,他们撰写的解释文章都篇幅很长,技术细节丰富,作为公关素材并不适合提炼“金句”和标题,但对理解从事大模型基础研发公司的第一性原理至关重要。Amodei关于可解释性的长文本身就在追求技术可解释性。他之前针对DeepSeek崛起的万字长文也是,反传统地提出V3比R1更具挑战性的观点,详细剖析了两款模型的技术差异。MiniMax的掌舵者闫俊杰同样如此,他非常想向外界解释为何MiniMax回归Full Attention机制,认为这个问题必须讲清楚——其实外界未必关心,牛X就够了。但对这两位技术一线的CEO而言,写长文进行技术反思和解释意味着什么?意味着他们需要说服自己,而不仅仅是投资人和用户;意味着他们相信透明比神秘感更重要;意味着他们愿意承认“我们之前错了”,并公开技术探索过程。在快节奏的AI竞赛中,这是非常奢侈的。

你可以想象Sam Altman和Elon Musk在这种情形下会怎么做:直接发布新模型,用刷新benchmark的性能震撼用户,完全用结果说话,不解释技术路线问题,或轻描淡写,让副手解释。但毕竟有创始人和CEO愿意站出来,详细解释技术细节。追求技术的可解释性和透明性,会让公司在更长时间赢得客户信任。客户愿意看到一家大模型公司“笨”的一面,这比“神奇”更重要。

“笨架构”与“好商业”追求技术可解释性与大众传播似乎存在对立。Anthropic曾在旧金山机场密集投放Claude模型广告,强调其安全性,但数月后便消失。MiniMax也为旗下Talkie和海螺视频投放过X和YouTube广告,但并不持续。OpenAI可能不投广告,但Sam Altman在社交网络和访谈中的高强度非技术言论已足够。我曾看到一条YouTube节目开篇先后播放了两条广告——分别来自Gemini3和K2,你得承认YouTube算法推荐足够精准,也得承认真有人在拼命砸广告。在国内,豆包、千问……暂且不表。Anthropic和MiniMax属于一开始“定力不足”,试了就缩回来,想明白后不再大张旗鼓的类型。

MiniMax CEO闫俊杰对此有自己的解释。在访谈中,他说:“过去三年,AI创新的主阵地是Web,不是手机APP。国际上前十产品,除了中国的豆包,其他都是先做Web,靠自然量起来的。能靠不买量做起来的,只有Web端。”言下之意,就是MiniMax不靠买量做C端爆款,不靠炒作声量,专注技术迭代。在中国AI创业环境里,这是相当“笨”的做法。但这使得MiniMax可能是今天最重视可持续经营的模型公司之一,招股书披露其现金储备超11亿美元,足够支撑53个月运营。而目前5亿美元的亏损规模,其实不及一些C端大厂AI产品一年投流费用。

还有更“笨”的做法。2023年下半年,大部分中国AI公司还在做稠密模型,MiniMax将80%算力all-in到MoE上。投资人黄明明回忆:“前两次失败了,直到第三次成功,他(指闫俊杰)才跑来告诉我们。我问他为什么赌这么大?赌不出来公司就挂了。”闫俊杰的回答是:“只有做出MoE,才能用更低成本向更高阶段演进。否则用的是不可估量的成本,没有一家公司能支持”。MiniMax在技术架构探索上有着强烈执念:2023年到2024年上半年深耕MoE,控制模型演进成本;2024年下半年到2025年初探索线性注意力机制,启动开源战略;2025年中开始侧重推理优化与工程优化,回归全面注意力机制。至于它在跨模态领域展现的模型能力——从语音(Speech-02-HD)和视频(Hailuo-02)领域的顶尖水平,到如今M2在文本和代码领域的突破,实则是基于基础架构持续探索与适配下打磨的一整套瑞士军刀。

实在不是牵强附会,MiniMax基于第一性原理(成本与性能平衡)的架构探索,与Anthropic的技术路径摸索有很多相似之处。2021-2023年,Anthropic侧重单一“安全”维度,2023年3月才发布第一代“安全”模型;2024年,通过Claude3家族迅速建立与GPT-4竞争能力,突破“安全”桎梏,在产品化上大刀阔斧;2024年底,将Agent与模型推理能力视作战略重心,先是MCP,再是Skill,成为AI Agent标准建立者。甚至基于Agent需求,探索从Constitutional AI向可解释性AI原理的基础技术转变。不同于MiniMax将架构思考渗透到不同模态产品中,Anthropic对多模态没有执念,其“瑞士军刀”是Claude模型的Haiku、Sonnet和Opus三个不同性能版本,相当于每一代瑞士军刀的三件套。这些对普通用户可能无感,但对AI研究人员却很有意义,尤其是企业级开发者,他们很容易找到所需工具和API。

接受访谈时,闫俊杰说:“技术驱动和产品驱动,两者可能都对,但没法共存。它的驱动力只能有一个。后面我们开始意识到,有可能那样一条路(产品驱动)也是对的,但它不适合我们。我们能做的,就只能是技术驱动。”潜台词是:他们曾纠结过,最终选择了技术驱动,知道会失去一些东西(如快速用户增长),但这唯一适合他们的路。这么做的结果是什么?真的是要忍受漫长的消费级市场默默无闻,等待5年甚至10年后的“效果涌现”吗?我们看看它们的商业化数据。2024年,Anthropic收入仅10亿美元;2025年仅3-5月,其营收规模就从20亿美元增长到30亿美元,Meritech分析师Alex Clayton表示:“我们研究了200多家上市软件公司IPO,这种增长速度从未发生过”。2025年上半年,Anthropic研发投入与营收比约为1.04:1,基本持平,在尚处军备竞赛阶段的AI产业已相当令人羡慕。它明显比OpenAI对应的1.56:1健康得多。

受限于资本投入、算力和市场规模,MiniMax自然无法与Anthropic全面相提并论,但《The Information》报道,MiniMax是目前亚洲唯一被证实拥有规模化全球收入的大模型公司——这些收入来自可持续、可规模化的产品(C端的海螺视频、Talkie,B端的API订阅),而非资本输血或薄利项目。MiniMax在招股说明书中披露的经过审计的营收数据更严格:2023年开始商业化,营收达346万美元;2024年飙升到3052万美元,同比增长782.2%;2025年前9个月,营收同比增长175%,达到5344万美元,已远超去年全年水平。截至2025年9月30日,C端收入同比增长181%,B端收入同比增长160%。毫无疑问,它呈现了一条极具想象力的营收曲线。而最能体现大模型实际调用量的OpenRouter数据显示,MiniMax M2是首个日token消耗量超500亿的中国模型,免费版加付费版日调用量超800亿,跻身Top10(分列第4和第7),用量高速增长。这意味着,向Anthropic一样靠卖API赚钱,接收企业信用卡收入;通过Stripe收取个人用户收入,而非承接大型部署项目,开具一两年后才兑换的企业支票,在MiniMax正在成为现实。此次招股书披露的关键数据显示,MiniMaxB端业务毛利率达69.4%,显著高于同行;整体毛利也从2023年的-24.7%快速转正,2024年为12.2%,2025年前九个月更是达到23.3%。

2014年,Anthropic CEO Dario Amodei还在百度实习时,就发现了Scaling Law(缩放定律)——大语言模型的核心原理。当时同样在百度实习、做深度学习实验的闫俊杰也在中科院自动化所读博士。闫俊杰回忆:“那时国内没有万卡,但那是唯一一个真正意义上的GPU集群。我用可能三分之一的GPU做实验。我开始意识到,AI这件事真的可以带来实际价值,而不只是写论文。”然而,中国错失了GPT-3.5的时间窗口,而Scaling Law其实是在2014年在中国发现的。亡羊补牢,有时确实太晚。接下来,是跳跃式发展,还是遵循内心和“第一性”?不同的人有不同的答案。有趣的是,Anthropic和MiniMax,这两个看似最不像的,甚至在地缘意义上处于某种微妙对立的公司,却选择了非常接近的答案。

最新快讯

2025年12月23日

13:06
2025年12月21日凌晨4时30分,黑龙江丰源矿业有限公司旗下的大通沟煤矿突发透水事故,导致5名矿工被困井下。经过连续多日的紧急救援行动,截至12月23日,所有被困人员均已成功搜寻到,但不幸的是,经确认5名矿工均无生命体征,最终确认全部遇难。事故地点位于黑龙江省大通沟地区,该煤矿属于黑龙江丰源矿业公司的重要生产单位。目前,救援工作已全面结束,善后处置工作正...
13:06
2025年12月23日,全球知名市场研究机构TrendForce集邦咨询发布最新行业报告,揭示电视面板市场迎来重要转折点。报告指出,12月份电视面板价格呈现全面持平态势,其中32英寸至65英寸主流尺寸面板成功止跌企稳,标志着市场底部区域基本确立。这一积极信号背后,是下游需求维持相对稳定的支撑,为面板厂商后续调整策略提供了重要参考。 在当前市场环境下,面板生产...
13:06
2025年12月23日,快手官方发布重要公告,宣布其核心直播功能已实现分阶段全面恢复。这一消息的发布,标志着此前遭受的网络攻击事件影响已基本消除。据了解,此次网络攻击事件发生在12月22日22时左右,快手应用遭遇了严重的系统冲击,导致直播服务出现大面积中断,影响了大量用户的正常使用。 面对突发状况,快手公司反应迅速,第一时间启动了完善的应急预案。技术团队立即...
13:06
2025年12月22日至23日,备受瞩目的全国住房城乡建设工作会议在北京隆重召开。此次会议聚焦“十五五”时期我国住房与城镇化发展新方向,为未来五年行业政策制定提供了重要指引。会议核心指出,当前房地产市场正经历深刻供求关系调整,必须准确把握这一阶段性特征,通过科学施策推动行业转型升级。同时强调要持续推进新型城镇化建设,优化城市存量空间布局,着力解决群众在住房品...
13:06
12月23日,中国有色金属工业协会锡业分会与中国电子行业协会电子材料锡焊料分会罕见联手,共同向行业发出了一份紧急倡议。此举针对的是近期锡价出现的非理性飙升现象,两协会在联合声明中明确指出,当前的价格波动已严重偏离产业基本面,其背后主要是由市场情绪过度波动和资金恶意炒作所驱动。这种失控的价格走势不仅极大地放大了市场风险,更对整个产业链和供应链的稳定造成了严重冲...
13:06
东风风行雷霆增程版于2025年12月23日正式登陆市场,售价定为12.99万元,仅提供单一配置车型。新车在造型设计上迎来全面革新,以简洁大气为主基调,车身长度得到显著提升至4600mm,更显稳重与气场。尾部设计尤为吸睛,采用贯穿式尾灯设计,搭配流畅的导流槽装饰,不仅提升了视觉张力,也优化了空气动力学性能。 内饰方面,新车全面换装14.6英寸中控大屏,取消传统...
13:06
2025年12月23日,vivo正式发布WATCH GT 2微信手表版重大功能升级,重磅推出语音输入转文字功能,让用户只需简单一句话即可快速生成文字,极大提升沟通效率。此次OTA升级不仅带来了核心功能的革新,还对系统性能进行了全面优化,包括缓存清理机制、英文界面适配以及会话标记与管理等实用改进,为用户带来更加流畅智能的使用体验。 自2022年7月首次上线以来...
13:06
2025年12月23日10时整,备受瞩目的长征十二号甲遥一运载火箭在东风商业航天创新试验区内拔地而起,以雷霆万钧之势直刺苍穹。火箭的二子级顺利进入预定轨道,而一子级也成功完成了回收任务的关键步骤,尽管最终回收未达预期,但整个飞行试验任务仍被评定为基本成功,为我国航天事业再添重要里程碑。 这款由航天科技集团八院精心研制的长征十二号甲火箭,不仅是我国第二款首飞即...
13:06
2025年12月23日,长春伟峰万豪万枫酒店盛大启幕,标志着万豪品牌在吉林地区的首次亮相,为当地商务与休闲旅客带来全新的住宿体验。酒店坐落于净月开发区郁金香街,周边汇聚众多企业及科研机构,地理位置优越,交通便捷。距离长春站仅24公里,乘坐高铁或私家车均可快速抵达;距龙嘉国际机场约45公里,轻松连接国内外宾客。作为万豪旗下的高端品牌,长春伟峰万豪万枫酒店精心打...
13:06
2025年12月22日,日本电子巨头罗姆公司与印度工业巨头塔塔电子正式宣布达成战略合作,共同开拓印度功率半导体制造市场。此次合作将充分发挥双方技术优势,通过强强联合加速印度本土化生产体系建设,并构建覆盖印度及全球市场的全方位销售网络。根据双方协议,罗姆将提供其先进的功率器件技术支持,而塔塔电子则凭借其卓越的后端封测能力,为合作项目提供全方位保障。 在合作的首...
13:06
2025年12月23日,微软公司正式对外澄清了近期关于Xbox设定30%利润率目标的传闻,明确表示该说法纯属误解。公司方面强调,Xbox的实际利润率目标设定在12%左右,这一数值与整个游戏行业的平均水平基本持平。虽然微软并未透露当前具体的利润率目标细节,但多次重申30%的目标完全不存在,以此消除外界疑虑。 此次回应的背景颇为复杂。此前,由于微软宣布裁员计划、...
13:05
2025年12月,Brother正式发布全新蓝牙标签打印机PT-E920BT,这款专为严苛行业场景打造的智能设备,将极大提升电力、数据中心及工业制造等领域的标识管理效率。作为一款面向专业用户的移动打印解决方案,PT-E920BT不仅拥有1.1公斤的精巧设计,更创新性地支持USB有线连接与内置锂电池无线供电的双重模式,完美适配从固定工位到移动巡检的多样化使用需...