近日,月之暗面(Moonshot AI)低调地将新一代大模型Kimi K2的代码开源至社区,迅速引发全球开发者热潮。这款拥有1万亿参数的”巨无霸”模型,凭借其卓越性能迅速成为焦点。美国AI搜索公司Perplexity CEO阿拉温德(Aravind Srinivas)在社交平台赞叹:”K2的表现远超预期,我们计划基于它进行深度训练。”海外开发者@Paul Couvert更是直言不讳:”K2性能几乎媲美Claude 4和GPT-4.1,关键还完全开源免费!”这次开源让月之暗面再次成为行业焦点,这个中国AI领域的”初代明星”在2024年凭借20万字长文本处理能力异军突起。创始人杨植麟被誉为”中国版奥特曼”,其理想主义的技术追求与摇滚精神为月之暗面注入独特魅力。
然而,这家公司近年来也面临重重挑战。买流量争议曾引发业界质疑,团队熊狸在K2发布后坦言:”停止投流后,应用商店搜索Kimi都难见第一页结果。”2025年初,投资人分歧导致仲裁纠纷,将公司卷入舆论漩涡至今未平。更严峻的冲击来自横空出世的DeepSeek,其R1模型的发布让包括Kimi在内的”AI六小龙”及大厂大模型都黯然失色。熊狸最近发帖称:”年初DeepSeek-R1暴涨后,很多人质疑Kimi是否已力不从心。”
但月之暗面内部却将此视为转机。熊狸透露,杨植麟进行了”比预期更激进的改革”:停止K1系列更新,集中资源攻克基础算法和K2。期间伴随不少争议,尤其当Agent产品爆火时,有人建议Kimi专注Agent而非大模型。熊狸以月之暗面特有的方式回应:”2025年智能上限仍由模型决定。作为AGI目标公司,若不追求技术极限,我绝不会留在这里。”他还调侃非技术理想主义同行,并回忆2024年智源大会上,当开复老师脱口而出”关注AI应用ROI”时,就知道某些公司已偏离方向。
目前”六小龙”分化明显:百川智能转向医疗垂类,零一万物停止超大模型训练转向中等规模企业服务。智谱AI、MiniMax、阶跃星辰仍坚持通用大模型路线,面临相似压力。产品端,智谱、阶跃、MiniMax持续推出新品,零一万物和百川则相对沉寂。在DeepSeek与阿里、字节、腾讯的双重挤压下,创业公司大模型产品挑战重重。月之暗面工程师在知乎透露,K2训练前进行了大量结构实验,发现除DeepSeek v3外,其他方案都难以超越,最终K2只能在v3框架内优化参数,在成本相当前提下提升性能。
市场端分化更为显著:MiniMax完成近3亿美元融资,估值超40亿美元并启动上市;而零一万物和百川则传出高管离职、生存危机,无新融资进展。熊狸强调:”AGI容不得分心犹豫,坚持追求未必成功,但犹豫必败。”如今看来,他的话正应验。那么,这些坚持Scaling Law、预训练和开源的技术理想主义者,能否最终实现目标?
-END-关注我们的官方微信公众号(ID:Gushiio),获取更多深度内容。