中国AI公司MiniMax最像Anthropic的真相

“中国的OpenAI”究竟是谁?媒体和分析机构普遍指向智谱,这家中国大模型AI创业公司正积极冲刺港交所IPO。招股说明书明确宣称:“2025年6月,智谱被美国OpenAI列为全球主要竞争对手。”毕竟,OpenAI引领了生成式人工智能的普及浪潮。任何投身大模型领域的企业,或多或少都会与OpenAI产生联系。最便捷的方式莫过于模仿OpenAI的成功模式,这或许是成为“中国的OpenAI”最直接的路径。那么,中国的Anthropic又是谁?表面上看,拥有自主基座模型、编程能力强、能整合基座模型与Agent能力、率先推出类似Computer Use功能的企业,才应被视为中国的Anthropic。但事实真的如此吗?Anthropic就是这样的存在吗?让我为你揭示一个颠覆认知的答案:MiniMax。MiniMax是另一家近期在港交所冲刺IPO的中国大模型AI公司。表面数据来看,MiniMax70%的收入来自C端用户,而Anthropic绝大多数收入源于B端;MiniMax拥有从语音到视频再到文本的全模态模型矩阵,Anthropic的Claude则专注于文本和编程,两者看似毫无关联。然而,它们实则惊人地相似。

“没有标签”是Anthropic与MiniMax最显著的共同点。创始人层面,Anthropic的Dario Amodei曾与几位OpenAI同事出走创业,源于对OpenAI商业化路线的不满。他们认为,在AI安全问题未彻底解决前,OpenAI将GPT-3交给微软使用,背离了技术理想主义初心。Dario Amodei在OpenAI担任研究副总裁,虽是技术主管,却并非聚光灯下的核心人物。他在获得生物物理学博士学位后,先在百度硅谷AI实验室工作,后加入Google从事语音识别,2016年才进入OpenAI。要给Dario Amodei贴标签十分困难:物理学博士?前OpenAI高管?AI安全专家?这些标签都部分准确,却都不够全面。2021年,闫俊杰从商汤离职创立MiniMax,同样担任副总裁、研究院副院长和智慧城市事业群CTO,也是技术主管出身,没有汤晓鸥式的创始人光环,甚至连“洋博士”都不是(中科院自动化所博士)。在罗永浩的对谈中,他坦言“我们是比较草根的团队,没啥背景”。这类技术主管出身的创业者,往往技术能力扎实,却缺乏领袖魅力训练,个人形象模糊,不擅长制造话题,更倾向于钻研技术细节,追求可解释性而非轰动效应。

让我们对比一下同期那些标签鲜明的创业者:OpenAI CEO Sam Altman,连续创业者,曾担任Y Combinator总裁,天生擅长聚光灯,擅长讲故事、制造声势,是硅谷人脉中枢,精通权力博弈。月之暗面(Kimi)创始人杨植麟,清华姚班本科,CMU博士,师从苹果AI负责人,30岁出头,“天才创业者”标签深入人心,还是摇滚乐手。就连Kimi的模型也自带“超长上下文”标签。但Dario Amodei和闫俊杰,很难用一句话概括其身份特质。他们在镜头前的表现平淡,语速缓慢,谈及技术时偶有激动,并不适合提炼“金句”。他们的公司业务也难以一言蔽之。MiniMax究竟是做什么的?视频生成?多模态?Agent?它都涉足,但每个产品都难以成为记忆点。技术上,M2曾位列开源模型排行榜第一,社区赞誉有加,但问及10位业内人士“MiniMax是做什么的”,答案必然五花八门。Anthropic同样如此。虽然很多人认为它专注于coding,但这与MiniMax做多模态的标签一样,看似精准实则片面。

Anthropic在编程领域的收入并不及企业API收入。它究竟是什么?Claude在C端的影响力远不及ChatGPT和Gemini,其本质难以被简单标签定义。“没有标签”在公众形象上是个挑战,但反过来看,这反而是它们最突出的标签。时间越长,“没有标签”的价值越凸显。因为,这正是当前大模型,特别是语言模型的发展趋势。模型能力正逐渐收敛,每家企业的优势都可能被竞争对手在数月内超越。Meta旗下的Llama曾备受瞩目,却被DeepSeek和Qwen迅速超越;两年前备受冷落的Google凭借Gemini3引发OpenAI警觉,成为全球模型之冠。DeepSeek和Google的优势能持续多久?无人知晓。在这种背景下,“没有标签”意味着人设不易崩塌,外界预期不会过高或过低,不会轻易被打脸,不会经历从云端跌落再反弹的过山车体验……“没有标签”,正逐渐成为安全感和确定性的来源。

看Claude,它经历过口碑的剧烈波动,但人们并未特别期待Claude5。无论是Claude4.5Sonnet还是Claude4.5Opus,用户依然踊跃使用,只是“炸裂”程度远不及Gemini3。MiniMax从01到M1再到M2,开源社区口碑一路攀升,OpenRouter数据显示其调用量超过许多更擅长社交媒体营销的开源模型。这是一种微妙而恰当的预期管理,对一家日益走向公众的公司尤为重要。在平衡损益表前,“进步”和“增长”是值得期待的,而“炸裂”和“翻车”则非如此。“没有标签”,反而应成为它们最重要的标签。

追求技术的可解释性2025年10月,MiniMax创始人和CEO闫俊杰在官方公众号发表技术长文《为什么MiniMax M2是一个Full Attention模型》。从text01到M1再到M2,MiniMax在模型预训练上经历了从线性注意力机制(Lightning Attention)回归全面注意力机制(Full Attention)的转变。团队发现线性注意力机制虽效果不错,但在复杂多跳推理任务中存在明显缺陷。随着模型与通用Agent功能趋近,“在Agent场景下,模型需要跨多个工具、跨上下文反复验证与调整。Hybrid Attention虽省算力,但易导致上下文信息缺失,造成逻辑中断”,闫俊杰在文章中坦诚了这一点,点明了M2回归Full Attention的原因。这种CEO公开承认技术试错的做法极为罕见。

这让我立刻联想到Anthropic CEO Dario Amodei今年4月在博客上发表的长文《The Urgency of Interpretability》(可解释性的紧迫性)。Amodei强调生成式AI的不透明问题,认为模型能力是“生长”而非“构建”的,与传统软件本质不同。这种不透明性导致AI安全和道德风险难以预测,因此迫切需要可解释性研究。重要的是,在这篇文章中,Amodei公开承认了他曾奉为圭臬的“Constitutional AI”(宪法式AI)的局限性。他认为Constitutional AI只能让模型“装作”遵循安全原则,内心可能另有想法。因此,Anthropic转向模型可解释性研究,目标是2027年用可解释性可靠检测大多数模型问题。这也是一次公开的技术路线试错。

无论是Amodei还是闫俊杰,他们撰写的解释文章都篇幅很长,技术细节丰富,作为公关素材并不适合提炼“金句”和标题,但对理解从事大模型基础研发公司的第一性原理至关重要。Amodei关于可解释性的长文本身就在追求技术可解释性。他之前针对DeepSeek崛起的万字长文也是,反传统地提出V3比R1更具挑战性的观点,详细剖析了两款模型的技术差异。MiniMax的掌舵者闫俊杰同样如此,他非常想向外界解释为何MiniMax回归Full Attention机制,认为这个问题必须讲清楚——其实外界未必关心,牛X就够了。但对这两位技术一线的CEO而言,写长文进行技术反思和解释意味着什么?意味着他们需要说服自己,而不仅仅是投资人和用户;意味着他们相信透明比神秘感更重要;意味着他们愿意承认“我们之前错了”,并公开技术探索过程。在快节奏的AI竞赛中,这是非常奢侈的。

你可以想象Sam Altman和Elon Musk在这种情形下会怎么做:直接发布新模型,用刷新benchmark的性能震撼用户,完全用结果说话,不解释技术路线问题,或轻描淡写,让副手解释。但毕竟有创始人和CEO愿意站出来,详细解释技术细节。追求技术的可解释性和透明性,会让公司在更长时间赢得客户信任。客户愿意看到一家大模型公司“笨”的一面,这比“神奇”更重要。

“笨架构”与“好商业”追求技术可解释性与大众传播似乎存在对立。Anthropic曾在旧金山机场密集投放Claude模型广告,强调其安全性,但数月后便消失。MiniMax也为旗下Talkie和海螺视频投放过X和YouTube广告,但并不持续。OpenAI可能不投广告,但Sam Altman在社交网络和访谈中的高强度非技术言论已足够。我曾看到一条YouTube节目开篇先后播放了两条广告——分别来自Gemini3和K2,你得承认YouTube算法推荐足够精准,也得承认真有人在拼命砸广告。在国内,豆包、千问……暂且不表。Anthropic和MiniMax属于一开始“定力不足”,试了就缩回来,想明白后不再大张旗鼓的类型。

MiniMax CEO闫俊杰对此有自己的解释。在访谈中,他说:“过去三年,AI创新的主阵地是Web,不是手机APP。国际上前十产品,除了中国的豆包,其他都是先做Web,靠自然量起来的。能靠不买量做起来的,只有Web端。”言下之意,就是MiniMax不靠买量做C端爆款,不靠炒作声量,专注技术迭代。在中国AI创业环境里,这是相当“笨”的做法。但这使得MiniMax可能是今天最重视可持续经营的模型公司之一,招股书披露其现金储备超11亿美元,足够支撑53个月运营。而目前5亿美元的亏损规模,其实不及一些C端大厂AI产品一年投流费用。

还有更“笨”的做法。2023年下半年,大部分中国AI公司还在做稠密模型,MiniMax将80%算力all-in到MoE上。投资人黄明明回忆:“前两次失败了,直到第三次成功,他(指闫俊杰)才跑来告诉我们。我问他为什么赌这么大?赌不出来公司就挂了。”闫俊杰的回答是:“只有做出MoE,才能用更低成本向更高阶段演进。否则用的是不可估量的成本,没有一家公司能支持”。MiniMax在技术架构探索上有着强烈执念:2023年到2024年上半年深耕MoE,控制模型演进成本;2024年下半年到2025年初探索线性注意力机制,启动开源战略;2025年中开始侧重推理优化与工程优化,回归全面注意力机制。至于它在跨模态领域展现的模型能力——从语音(Speech-02-HD)和视频(Hailuo-02)领域的顶尖水平,到如今M2在文本和代码领域的突破,实则是基于基础架构持续探索与适配下打磨的一整套瑞士军刀。

实在不是牵强附会,MiniMax基于第一性原理(成本与性能平衡)的架构探索,与Anthropic的技术路径摸索有很多相似之处。2021-2023年,Anthropic侧重单一“安全”维度,2023年3月才发布第一代“安全”模型;2024年,通过Claude3家族迅速建立与GPT-4竞争能力,突破“安全”桎梏,在产品化上大刀阔斧;2024年底,将Agent与模型推理能力视作战略重心,先是MCP,再是Skill,成为AI Agent标准建立者。甚至基于Agent需求,探索从Constitutional AI向可解释性AI原理的基础技术转变。不同于MiniMax将架构思考渗透到不同模态产品中,Anthropic对多模态没有执念,其“瑞士军刀”是Claude模型的Haiku、Sonnet和Opus三个不同性能版本,相当于每一代瑞士军刀的三件套。这些对普通用户可能无感,但对AI研究人员却很有意义,尤其是企业级开发者,他们很容易找到所需工具和API。

接受访谈时,闫俊杰说:“技术驱动和产品驱动,两者可能都对,但没法共存。它的驱动力只能有一个。后面我们开始意识到,有可能那样一条路(产品驱动)也是对的,但它不适合我们。我们能做的,就只能是技术驱动。”潜台词是:他们曾纠结过,最终选择了技术驱动,知道会失去一些东西(如快速用户增长),但这唯一适合他们的路。这么做的结果是什么?真的是要忍受漫长的消费级市场默默无闻,等待5年甚至10年后的“效果涌现”吗?我们看看它们的商业化数据。2024年,Anthropic收入仅10亿美元;2025年仅3-5月,其营收规模就从20亿美元增长到30亿美元,Meritech分析师Alex Clayton表示:“我们研究了200多家上市软件公司IPO,这种增长速度从未发生过”。2025年上半年,Anthropic研发投入与营收比约为1.04:1,基本持平,在尚处军备竞赛阶段的AI产业已相当令人羡慕。它明显比OpenAI对应的1.56:1健康得多。

受限于资本投入、算力和市场规模,MiniMax自然无法与Anthropic全面相提并论,但《The Information》报道,MiniMax是目前亚洲唯一被证实拥有规模化全球收入的大模型公司——这些收入来自可持续、可规模化的产品(C端的海螺视频、Talkie,B端的API订阅),而非资本输血或薄利项目。MiniMax在招股说明书中披露的经过审计的营收数据更严格:2023年开始商业化,营收达346万美元;2024年飙升到3052万美元,同比增长782.2%;2025年前9个月,营收同比增长175%,达到5344万美元,已远超去年全年水平。截至2025年9月30日,C端收入同比增长181%,B端收入同比增长160%。毫无疑问,它呈现了一条极具想象力的营收曲线。而最能体现大模型实际调用量的OpenRouter数据显示,MiniMax M2是首个日token消耗量超500亿的中国模型,免费版加付费版日调用量超800亿,跻身Top10(分列第4和第7),用量高速增长。这意味着,向Anthropic一样靠卖API赚钱,接收企业信用卡收入;通过Stripe收取个人用户收入,而非承接大型部署项目,开具一两年后才兑换的企业支票,在MiniMax正在成为现实。此次招股书披露的关键数据显示,MiniMaxB端业务毛利率达69.4%,显著高于同行;整体毛利也从2023年的-24.7%快速转正,2024年为12.2%,2025年前九个月更是达到23.3%。

2014年,Anthropic CEO Dario Amodei还在百度实习时,就发现了Scaling Law(缩放定律)——大语言模型的核心原理。当时同样在百度实习、做深度学习实验的闫俊杰也在中科院自动化所读博士。闫俊杰回忆:“那时国内没有万卡,但那是唯一一个真正意义上的GPU集群。我用可能三分之一的GPU做实验。我开始意识到,AI这件事真的可以带来实际价值,而不只是写论文。”然而,中国错失了GPT-3.5的时间窗口,而Scaling Law其实是在2014年在中国发现的。亡羊补牢,有时确实太晚。接下来,是跳跃式发展,还是遵循内心和“第一性”?不同的人有不同的答案。有趣的是,Anthropic和MiniMax,这两个看似最不像的,甚至在地缘意义上处于某种微妙对立的公司,却选择了非常接近的答案。

最新快讯

2025年12月23日

14:09
近日山东临沂街头上演了一幕令人忍俊不禁的奇景。孔先生正耐心等待红灯变绿时突然发现前方车辆车顶上竟稳稳当当地放着一盘饺子饺子饱满新鲜仿佛还带着水汽的汁液在阳光下闪闪发光这一画面实在太有冲击力让孔先生当场呆住心里直犯嘀咕"这车顶能放稳饺子?难道是车主包完饺子后匆忙忘拿了?"这既温馨又搞笑的场景让孔先生立刻掏出手机拍下了这难忘瞬间当视频发布到网络后立刻引发网友热议...
14:09
微新创想12月23日消息,雷军今日发文介绍了小米17 Ultra的徕卡2亿像素光学变焦。雷军称,这是小米徕卡光学极致小型化的又一力作,与相机变焦镜头技术原理一脉相承,变焦行程内支持全2亿像素光学直出。另外,小米17 Ultra还拥有4大黄金人像焦段,由一颗镜头全覆盖。据悉,对比上代15 Ultra的2亿像素,这一代旗舰有了大幅升...
14:09
微新创想12月23日重磅报道,小米米家电动剃须刀Pro今日正式开售,首发售价469元,限时优惠到手仅需398.65元。这款新品标志着米家电动剃须刀系列迈入Pro级时代,首次创新性地搭载了智能压感提醒系统,能够实时监测并精准分析剃须过程中的力度变化。 背部特别设计的灯环会随着按压力度灵活变色,通过视觉反馈有效避免因按压过重导致的肌肤剃伤或红肿问题,同时也能防止...
14:09
微新创想12月23日讯,今日,阿里巴巴的Z-Image模型在开源图像生成领域再创佳绩,成功登顶全球权威AI基准测试平台ArtificialAnalysis最新发布的图像模型榜单。这一突破性的成就标志着阿里6B参数的Z-Image Turbo模型,凭借其卓越性能超越了32B参数的FLUX.2,一跃成为当前最强开源图像生成模型。值得注意的是,该模型已率先在阿里云...
14:07
截至2025年12月,Steam平台已有10258款游戏公开宣布采用生成式AI技术,这一数字约占平台总游戏量的8%,展现出AI在游戏开发领域的快速渗透。据Totally Human Media的权威估算,这些使用AI技术的游戏累计销售额高达6.6亿美元,其中45款游戏的营收突破百万美元大关,成为AI赋能的典型案例。 AI在游戏开发中的应用主要集中在美术素...
14:07
2025年12月23日,投资银行杰富瑞发布最新研报,将雅诗兰黛集团的目标股价从90美元上调至100美元,涨幅达11%。这一显著上调反映了市场分析师对雅诗兰黛未来业绩的强烈信心。报告指出,雅诗兰黛在高端护肤及香水市场的卓越表现是推动股价上调的核心动力。品牌凭借其强大的产品创新能力和品牌溢价能力,持续领跑高端美妆市场,为集团带来稳健的营收增长。分析师认为,雅诗兰...
14:07
2025年12月23日,海南省生态环境厅、自然资源厅、交通运输厅、商务厅与发改委五部门联合印发《关于推进自贸港零碳园区建设的指导意见》,正式吹响海南绿色低碳转型的号角。该政策文件明确指出,将分阶段推进园区低碳化、零碳化改造工程,优先支持具备条件的园区率先开展试点示范,打造自贸港绿色发展样板。 文件强调将通过多元化资金保障机制,为园区绿色转型提供坚实支撑。一方...
14:07
12月18日,备受瞩目的广东战略性新兴产业基金在广州正式宣告成立,这一具有里程碑意义的举措标志着广东省在推动经济高质量发展方面迈出了坚实一步。该基金由广东省财政厅全资控股,初始注册资本高达500亿元人民币,为广东省战略性新兴产业的蓬勃发展注入了强劲动力。作为广东省政府重点打造的产业投资平台,该基金将聚焦于新一代信息技术、生物医药、新能源、新材料等战略性新兴领...
14:07
2025年12月23日,海信正式官宣将亮相CES 2026展会,并宣布将重点展示其在激光家庭影院领域的最新成果。作为行业领军品牌,海信将携两款基于多色激光技术的创新产品震撼登场:旗舰级投影仪XR10与超短焦机型PX4-PRO。这两款新品不仅代表了海信在高端影音领域的最新技术突破,更彰显了其致力于打造极致家庭影院体验的坚定决心。 XR10旗舰投影仪搭载业界领先...
14:07
2025年12月22日,银河通用机器人与百达精工正式达成战略合作,双方将携手在工业精密制造领域部署超过1000台具身智能机器人,开启智能制造新篇章。此次合作的核心目标在于构建"系统共生"的生产体系,实现从原料仓储、加工到质检的全流程自动化覆盖,显著提升柔性制造能力。银河通用机器人凭借其自主研发的具身大模型技术,已成功实现抓取、搬运等任务的跨场景泛化应用,并在...
14:07
最新消息显示,知名游戏开发商动视已正式计划于2026年将《使命召唤》系列重磅作品登陆任天堂Switch 2平台。这一消息由权威科技媒体率先披露,引发全球玩家高度关注。值得注意的是,尽管微软作为系列母公司早已公开承诺将《使命召唤》带到任天堂平台,但实际适配进度却因开发套件分发的诸多限制而显得缓慢滞后。 资深游戏编辑Jez Corden在最新采访中明确指出,开发...
14:07
2025年12月23日,陕西汉中750千伏变电站成功带电,标志着国内首条跨越秦岭的750千伏输变电工程正式投运。该工程全长459公里,于2024年5月开工,是国家电网“十四五”规划重点项目,也是陕西省首条关中接入汉中的750千伏超高压交流线路。工程穿越秦岭无人区,建成投运后将显著提升陕南电网输送能力,实现全省风电、光伏等清洁能源的并网消纳与优化配置。