Moonshot AI月之暗面,作为中国大模型领域最神秘的创业公司之一,正以其颠覆性的技术突破引发全球瞩目。这家由清华大学交叉信息学院智源青年科学家杨植麟教授创立的公司,不仅拥有Transformer-X与XLNet这两篇深度学习领域里程碑式论文的署名,更在短短半年内实现了长文本处理技术的革命性突破。创始人杨植麟教授的学术生涯堪称传奇,尽管小学初中时期父母并未对他设定过高的分数目标,但这段经历反而赋予了他极大的自主探索空间。高中时,毫无编程基础的杨植麟意外入选奥林匹克竞赛培训班,最终通过竞赛保送清华大学,师从AI泰斗唐杰教授,连续四年稳居年级第一。课业之余,他还组建乐队担任鼓手与创作者,展现了不拘一格的多元才华。在卡内基梅隆大学攻读博士期间,他更是在四年内完成了通常需要六年的课程,师从苹果AI负责人Ruslan Salakhutdinov与谷歌首席科学家William Cohen等顶尖学者。

今年6月,硅谷权威科技媒体The Information评选出可能成为”中国OpenAI”的五家候选机构,MiniMax、智谱AI、光年之外、澜舟科技赫然在列,而杨植麟作为唯一个人候选人被列入其中。10月9日,成立仅半年的Moonshot AI正式宣布推出智能助手产品Kimi Chat,其支持的20万汉字上下文输入长度,刷新了全球大模型服务的产品化记录。这一突破性技术不仅显著优于Anthropic的Claude-100k(实测8万字)和OpenAI的GPT-4-32k(实测2.5万字),更将Moonshot AI的ToC超级应用战略推向新高度。相较于此前专注ToB的循环智能项目,杨植麟反复强调Moonshot AI将始终聚焦消费级大模型应用,致力于打造大模型时代的超级应用生态。

Moonshot AI的核心团队堪称豪华,除了杨植麟教授,联合创始人周昕宇和吴育昕均毕业于清华大学,50人规模的团队中更有来自Google、Meta、Amazon等科技巨头的海外人才。今年6月,公司完成首轮融资,红杉资本、今日资本、砺思资本等知名投资机构合计投入近20亿元,为Moonshot AI的持续研发注入强劲动力。杨植麟表示,当前市场对公司的估值存在较大低估,后续将通过官方渠道正式公布。首轮融资将全部用于技术产品研发和团队扩充,为后续商业化奠定坚实基础。

当前大模型普遍面临的输入长度限制问题,已成为制约技术落地的关键瓶颈。在虚拟角色场景中,由于长文本能力不足,角色常会忘记多轮对话中的关键信息,用户不得不频繁重启对话。而Kimi Chat的超长上下文处理能力,将彻底改变这一现状。无论是公众号长文的智能总结、英伟达财报的关键信息分析,还是海量发票的快速整理、算法论文的复现代码,甚至是与《月亮与六便士》整本书的深度互动,Kimi Chat都能提供前所未有的智能体验。当模型能够处理更长的上下文后,其应用场景将实现跨越式拓展,同时有效解决当前大模型普遍存在的”幻觉”问题。

Moonshot AI的技术突破并非建立在”捷径”之上。传统大模型受限于参数量与上下文长度的矛盾,往往采用滑动窗口、降采样等方案,但这些都以牺牲性能为代价。杨植麟指出,长文本技术的开发存在三大误区:容易”健忘”的”金鱼”模型、只关注局部的”蜜蜂”模型,以及通过减少参数量换取长上下文的”蝌蚪”模型。Moonshot AI选择直面算法与工程的双重挑战,通过创新网络结构和工程优化,实现了真正意义上的大内存模型产品化。

在训练层面,团队攻克了三大技术难关:如何在百万级上下文窗口中精准定位关键信息而不降低基础能力;如何满足千亿级参数模型训练所需的超高算力和显存;如何解决高质量长序列数据的匮乏问题。在推理层面,Moonshot AI更是突破了多项技术壁垒:通过优化Transformer模型的自注意力机制,大幅降低计算复杂度;创新显存管理方案,突破传统单机配置限制;通过显存带宽优化技术,实现超长文本的流畅处理。这些创新使Moonshot AI得以绕开传统捷径,打造出真正实用的大模型产品。

杨植麟教授曾提出,无论是文字、语音还是视频,无损压缩技术都能实现高程度智能,而长上下文窗口技术正是实现多模态数据生成的关键。Moonshot AI选择扩展上下文长度的策略,源于团队对大模型底层逻辑的深刻理解、强大的技术实力以及对应用需求的精准把握。他坚信,更长的上下文长度将开启大模型应用的新纪元,推动大模型从LLM时代迈入L(Long)LLM时代。这仅仅是Moonshot AI在下一代大模型技术探索中的第一步,未来将带来更多令人期待的技术突破。

最新快讯

2025年11月20日

08:37
2025年11月19日,全球知名电子产品维修平台iFixit发布了一份深度拆解报告,首次揭示了苹果公司在iPhone Air的USB-C接口外壳上创新性地应用了3D打印金属工艺这一前沿技术。据报告详细披露,该关键零件采用先进的BLT激光粉末床熔融设备,以回收钛金属为原料进行精密制造。经过特殊工艺处理,零件表面呈现出别具一格的链状纹理,初步分析认为这可能是通过...
08:37
2025年11月19日晚,备受瞩目的东风风行星海S7 800V超快充版正式揭开神秘面纱,正式登陆市场。新车共推出四款车型,分别搭载565km和650km两种续航版本,并特别推出限时置换一口价活动,起售价仅为10.59万元,为消费者带来极具吸引力的购车选择。 作为基于东风汽车全域800V高压平台打造的旗舰车型,星海S7 800V超快充版在性能与效率上实现了...
08:37
2026款特斯拉Model X的轻量化成果在近日浮出水面,特斯拉车辆工程副总裁拉尔斯・莫拉维于2025年11月18日确认,该车型实测重量仅为2367kg,较2016款Model X实现了181kg的显著减重。在当前汽车行业普遍面临增重趋势的背景下,Model X凭借一系列创新技术升级,成功实现了逆势瘦身,展现出特斯拉在车身轻量化领域的领先实力。 电机系统的革...
08:03
11月17日,成都卡诺普机器人技术股份有限公司正式向香港交易所提交了上市申请,并指定国泰君安证券作为独家保荐机构。这家成立于2012年的企业专注于工业机器人领域,凭借卓越的技术实力和市场表现,已成长为行业领军者。根据2024年的财务数据,卡诺普不仅是中国最大的焊接机器人出口商,更在国内焊接机器人制造商中稳居首位,展现出强大的国际竞争力。 公司由李良军、朱路生...
08:03
2025年11月20日,联想集团正式发布了其截至2025年9月30日的第二财季财务报告,展现出强劲的增长势头与卓越的市场表现。财报显示,联想集团本季度总营收高达1464亿元人民币,同比增长15%,不仅刷新了历史记录,更彰显了其持续稳健的发展态势。令人欣喜的是,经调整净利润也达到了36.6亿元,同比增长25%,进一步印证了公司业务的健康运营与盈利能力的显著提升...
08:03
2025年11月19日,OpenAI正式发布了全新的智能体编程模型——GPT-5.1-Codex-Max,这一突破性进展标志着Codex系列发展进入新纪元。作为Codex界面的默认模型,GPT-5.1-Codex-Max不仅继承了前代产品的强大功能,更在性能上实现了质的飞跃。该模型创新性地引入了"压缩"机制,能够在数百万级别的token上下文中实现持续高效运...
08:03
北京互联网法院近日审理了一起备受关注的直播带货纠纷案,最终以消费者胜诉告终。法院认定涉事商家存在虚构中奖订单、拒不履行促销承诺等欺诈行为,依法作出判决。这一案例不仅为消费者维权提供了有力支持,也为直播带货行业敲响了警钟。 2025年2月13日,原告孙某在被告直播间积极参与促销活动,成功抢下首单并支付299元。当时公屏实时显示其位列前两名,符合"前两名下单免单...
08:03
2025年11月19日,汽车行业传来重磅消息,广汽丰田宣布将在2026年全面停产两款核心燃油车型,其中一款月销量突破千辆的紧凑级轿车,以及一款年销量超过万台的中型SUV,这两款车型合计销量占其2025年前10个月总销量的五分之一。这一决策背后,是丰田中国对产品策略的重大调整,核心在于终止向两家合资企业投放“姊妹车型”。受此影响,一汽丰田也将停产一款年销量逾万...
08:03
2025年11月20日,科技界迎来重磅消息Meta首席科学家杨立昆正式宣布,在为公司效力十二载后决定离职,并将创立一家专注于Advanced Machine Intelligence(AMI)的AI初创企业。这一决定不仅标志着杨立昆职业生涯的全新起点,更预示着AI领域即将迎来新的变革浪潮。 自2013年加入Meta以来,杨立昆始终致力于推动AI技术的边界拓展...
07:22
2025年11月20日,科技巨头英伟达发布最新季度财报,其业绩表现惊艳市场,被公司内部誉为"杰出的"。总部位于美国加州圣克拉拉的创新先锋,在CEO黄仁勋的卓越领导下,正引领全球AI芯片市场的蓬勃发展。这份亮眼财报不仅彰显了英伟达在人工智能硬件领域的领导地位,更印证了其技术战略的前瞻性。 财报发布之际,英伟达再次重申其雄心勃勃的5000亿美元年收入长期目标。这...
07:22
2025年11月20日,科技巨头英伟达成功举办了备受瞩目的分析师电话会议。这场重要会议于美国当地时间晚间举行,吸引了公司高层管理人员与众多资深金融分析师的积极参与。与会嘉宾围绕最新财务报告、业务发展现状以及未来战略规划展开了深入交流。 本次会议的核心议题聚焦于英伟达在人工智能芯片市场的卓越表现、数据中心业务的增长引擎以及全球供应链的优化布局。通过先进的线...
07:22
2025年11月19日,电池级碳酸锂市场价格强势突破97550元/吨,创下年内历史新高。这一显著的价格上涨主要得益于锂资源供需格局的持续变化,而具备成本优势的盐湖提锂产业链正因此迎来前所未有的发展机遇。作为全球最大的盐湖提锂基地,我国青海地区在提锂技术上已取得重大突破,成功实现了自主“吸附+膜法”提锂技术的产业化应用。 经过近20年的持续技术攻关与积累,这一...