Moonshot AI月之暗面,作为中国大模型领域最神秘的创业公司之一,正以其颠覆性的技术突破引发全球瞩目。这家由清华大学交叉信息学院智源青年科学家杨植麟教授创立的公司,不仅拥有Transformer-X与XLNet这两篇深度学习领域里程碑式论文的署名,更在短短半年内实现了长文本处理技术的革命性突破。创始人杨植麟教授的学术生涯堪称传奇,尽管小学初中时期父母并未对他设定过高的分数目标,但这段经历反而赋予了他极大的自主探索空间。高中时,毫无编程基础的杨植麟意外入选奥林匹克竞赛培训班,最终通过竞赛保送清华大学,师从AI泰斗唐杰教授,连续四年稳居年级第一。课业之余,他还组建乐队担任鼓手与创作者,展现了不拘一格的多元才华。在卡内基梅隆大学攻读博士期间,他更是在四年内完成了通常需要六年的课程,师从苹果AI负责人Ruslan Salakhutdinov与谷歌首席科学家William Cohen等顶尖学者。

今年6月,硅谷权威科技媒体The Information评选出可能成为”中国OpenAI”的五家候选机构,MiniMax、智谱AI、光年之外、澜舟科技赫然在列,而杨植麟作为唯一个人候选人被列入其中。10月9日,成立仅半年的Moonshot AI正式宣布推出智能助手产品Kimi Chat,其支持的20万汉字上下文输入长度,刷新了全球大模型服务的产品化记录。这一突破性技术不仅显著优于Anthropic的Claude-100k(实测8万字)和OpenAI的GPT-4-32k(实测2.5万字),更将Moonshot AI的ToC超级应用战略推向新高度。相较于此前专注ToB的循环智能项目,杨植麟反复强调Moonshot AI将始终聚焦消费级大模型应用,致力于打造大模型时代的超级应用生态。

Moonshot AI的核心团队堪称豪华,除了杨植麟教授,联合创始人周昕宇和吴育昕均毕业于清华大学,50人规模的团队中更有来自Google、Meta、Amazon等科技巨头的海外人才。今年6月,公司完成首轮融资,红杉资本、今日资本、砺思资本等知名投资机构合计投入近20亿元,为Moonshot AI的持续研发注入强劲动力。杨植麟表示,当前市场对公司的估值存在较大低估,后续将通过官方渠道正式公布。首轮融资将全部用于技术产品研发和团队扩充,为后续商业化奠定坚实基础。

当前大模型普遍面临的输入长度限制问题,已成为制约技术落地的关键瓶颈。在虚拟角色场景中,由于长文本能力不足,角色常会忘记多轮对话中的关键信息,用户不得不频繁重启对话。而Kimi Chat的超长上下文处理能力,将彻底改变这一现状。无论是公众号长文的智能总结、英伟达财报的关键信息分析,还是海量发票的快速整理、算法论文的复现代码,甚至是与《月亮与六便士》整本书的深度互动,Kimi Chat都能提供前所未有的智能体验。当模型能够处理更长的上下文后,其应用场景将实现跨越式拓展,同时有效解决当前大模型普遍存在的”幻觉”问题。

Moonshot AI的技术突破并非建立在”捷径”之上。传统大模型受限于参数量与上下文长度的矛盾,往往采用滑动窗口、降采样等方案,但这些都以牺牲性能为代价。杨植麟指出,长文本技术的开发存在三大误区:容易”健忘”的”金鱼”模型、只关注局部的”蜜蜂”模型,以及通过减少参数量换取长上下文的”蝌蚪”模型。Moonshot AI选择直面算法与工程的双重挑战,通过创新网络结构和工程优化,实现了真正意义上的大内存模型产品化。

在训练层面,团队攻克了三大技术难关:如何在百万级上下文窗口中精准定位关键信息而不降低基础能力;如何满足千亿级参数模型训练所需的超高算力和显存;如何解决高质量长序列数据的匮乏问题。在推理层面,Moonshot AI更是突破了多项技术壁垒:通过优化Transformer模型的自注意力机制,大幅降低计算复杂度;创新显存管理方案,突破传统单机配置限制;通过显存带宽优化技术,实现超长文本的流畅处理。这些创新使Moonshot AI得以绕开传统捷径,打造出真正实用的大模型产品。

杨植麟教授曾提出,无论是文字、语音还是视频,无损压缩技术都能实现高程度智能,而长上下文窗口技术正是实现多模态数据生成的关键。Moonshot AI选择扩展上下文长度的策略,源于团队对大模型底层逻辑的深刻理解、强大的技术实力以及对应用需求的精准把握。他坚信,更长的上下文长度将开启大模型应用的新纪元,推动大模型从LLM时代迈入L(Long)LLM时代。这仅仅是Moonshot AI在下一代大模型技术探索中的第一步,未来将带来更多令人期待的技术突破。

最新快讯

2026年02月11日

20:58
微新创想:2026年2月17日,PlayStation Plus Extra与Premium会员将可游玩《漫威蜘蛛侠2》《无限试驾:太阳王冠》及《Neva》。这一消息由爆料人billbil-kun提前披露,引发玩家广泛关注。三款游戏均支持PS5平台,其中《Neva》还兼容PS4,确保更多玩家能够体验。索尼计划在2月13日6时举行State of Play发布...
20:58
微新创想:2026年2月11日,Counterpoint Research发布最新《高端电视显示面板成本报告》。报告显示,2026年130英寸UHD LCD模块成本约为116英寸的1.5倍;IJP OLED虽材料成本更低,但因新产线折旧高,综合成本暂无优势;QD-OLED良率提升超预期,但受折旧与SG&A拖累,成本仍比同尺寸WOLED高60%–65%...
20:24
微新创想:2026年2月11日,中国南方航空接收第九架国产C919飞机并正式投入运营,首航执飞广州至西安航线。这标志着南航在国产大飞机运营方面迈出了坚实一步,进一步丰富了其机队结构。 该机将于春运期间每日执行长沙黄花机场至北京大兴机场2个往返航班,分别为CZ3717/CZ3718和CZ3147/CZ6137。这一安排不仅提升了航线的运力,也为旅客提供了更多便...
20:24
微新创想:2026年2月11日 爆料人Evan Blass公布联想moto Edge 70 Fusion官方海报 该机将于近期发布 提供乡村空气 冲浪蓝 运动绿 东方蓝和剪影五种潘通认证配色 手机采用曲面屏设计 后置三摄 搭载骁龙7s Gen 3处理器 最高12GB RAM+256GB存储 内置7000mAh电池 支持68W有线快充 具体上市时间与售价尚未公...
20:24
微新创想:2026年2月,保时捷在瑞典北部和德国偏远地区启动了2028款Panamera的测试工作。此次测试涉及两辆经过伪装的测试车辆,它们均配备了全新的倾斜式格栅设计,进一步强化了前脸的视觉冲击力。同时,新车还采用了更新的Matrix LED灯组,提升了照明效果与辨识度。 微新创想:在安全辅助系统方面,2028款Panamera将搭载与纯电Macan同款的...
20:24
微新创想:2026年2月11日,曜越正式发布新款49英寸曲面带鱼屏显示器TGM-V49CDQ 这款显示器采用了5120×1440的高分辨率设计,为用户带来更加细腻的视觉体验。240Hz的刷新率确保了画面的流畅性,特别适合对帧率要求较高的游戏和视频编辑场景。Fast VA面板不仅提升了色彩表现力,还优化了对比度和视角,让屏幕在不同角度下依然保持出色的显示效果 ...
20:24
微新创想:2026年2月11日,复星集团控股的葡萄牙忠诚保险公司(Fidelidade)正推进首次公开募股(IPO)计划。据知情人士透露,该公司的潜在估值已超过30亿欧元。此次IPO由复星国际主导,预计将在里斯本证券交易所进行,同时也有引入战略投资者的可能性。这一举措被视为复星集团优化其海外保险资产结构的重要一步,有助于提升资本使用效率和增强市场影响力。 目...
20:24
微新创想:2026年2月11日,航旅纵横民航官方直销平台正式上线春运机票“买贵免费退”服务。这一创新举措为旅客提供了更灵活的购票选择,增强了出行的保障性。旅客在该平台购买带有“买贵退”标签的机票后,若在出票24小时内发现同一航班存在更低价格,可购买新票并提交退旧票申请,享受免费退票服务。 该服务覆盖了国航、南航、东航等国内主要航空公司,后续还将逐步拓展至更多...
20:24
微新创想:2026年2月10日,微软在“补丁星期二”更新中修复了Windows记事本应用的高危远程代码执行漏洞(CVE-2026-20841)。该漏洞影响通过Microsoft Store分发的新版记事本,特别是在处理恶意Markdown(.md)文件时,用户点击特制链接即可触发远程代码执行,进而导致系统被完全控制。 漏洞的根本原因在于记事本对命令中特殊字符...
20:24
微新创想:2026年2月11日,游戏科学创始人冯骥就AI生成游戏能力发表评论。他在试用Seedance 2.0后指出,AIGC已结束童年时代,并调侃若AI真能轻松制作《黑神话:悟空》同级作品,团队或将转型为‘新时代非遗手工作坊’。 该回应发生于其个人社交平台,针对网友关于AI冲击高品质单机游戏开发的提问。冯骥强调,当前顶尖游戏仍高度依赖创意、审美与工程深度协...
20:24
微新创想:2026年2月11日,江钨装备(600397.SH)发布公告,计划向特定对象发行不超过2.97亿股A股,募集资金总额不超过18.82亿元。此次发行的目的是通过全资收购江西江钨硬质合金有限公司、赣州华茂钨材料有限公司以及九江有色金属冶炼有限公司,实现对相关企业100%股权的掌控。此举将有助于公司整合钨与钽铌产业链资源,进一步优化产业布局,提升整体竞争...
20:24
微新创想:2026年2月11日,一项国际研究取得重大突破,成功制备出一种能够特异性识别细菌表面伪胺酸分子的合成抗体。伪胺酸是一种独特的糖分子,仅存在于多种致病菌中,对于细菌的生存和致病能力具有关键作用。由于人体内并不存在该分子,因此这种合成抗体展现出极高的靶向性,同时大大降低了对非目标组织的潜在伤害。 微新创想:这项研究的成果为解决抗生素耐药性问题提供了全新...