高端GPU市场持续供不应求之际,一家挑战英伟达地位的新兴芯片初创公司成为行业焦点。独角兽企业SambaNova最新发布的AI芯片SN40L,仅凭8枚芯片即可支持高达5万亿参数的大模型——这一规模是GPT-4的三倍。型号中的”40″代表第四代产品,”L”则专指针对大语言模型(LLM)的深度优化:配备1.5TB内存,支持25.6万个token的序列长度。CEO Rodrigo Liang强调,采用他们方案运行万亿参数大模型的总拥有成本仅为行业标准的1/25。

SambaNova目前估值50亿美元(约365亿人民币),累计完成6轮总计11亿美元的融资,投资方阵容堪称豪华,包括英特尔、软银、三星、GV等业界巨头。这家公司不仅在芯片技术层面要挑战英伟达,其业务模式更计划超越竞争对手:直接参与企业私有大模型的训练服务。其目标客户群雄心勃勃——瞄准全球前2000家企业。

最新产品SN40L采用台积电5纳米工艺制造,集成1020亿晶体管,峰值速度达638TeraFLOPS。与英伟达H100(80GB HBM3)和AMD MI300(192GB HBM3)等竞品不同,SN40L创新性地采用了三层Dataflow内存系统:520MB片上SRAM、65GB高带宽HBM3内存,以及高达1.5TB的外部DRAM内存。虽然HBM3容量不及对手,但SambaNova通过专用软件编译器智能分配三层内存负载,并可将8个芯片虚拟为单一系统。

在硬件层面,SN40L还针对大模型特性开发了混合计算加速方案。团队发现大模型中大量权重参数为0,将计算资源用于这些无效操作效率极低。为此,他们研发了软件层面的加速技术,优化调度与数据传输流程,但具体实现细节尚未公开。Gartner分析师Chirag Dekate指出,SN40L可能在大模型多模态应用上具有优势,其硬件架构比传统GPU更灵活,能更好地处理图像、视频、文本等多样化数据。

目前SambaNova已获得多家重量级客户,包括日本富岳、美国阿贡与劳伦斯国家实验室等顶尖超算中心,以及埃森哲等咨询巨头。其商业模式颇具特色——不单独销售芯片,而是提供从芯片到服务器系统的定制技术栈,甚至包括大模型部署服务。为此,公司与TogetherML合作开发了BloomChat,一个基于BigScience开源模型Bloom的1760亿参数多语言聊天大模型,该模型在OpenChatKit、Dolly2.0和OASST1数据集上进行了微调,训练过程全程使用SambaNova独特的数据流架构。

在与The Next Platform的交流中,Rodrigo Liang表示当前公开数据集已接近枯竭,但企业对参数规模的需求仍在持续增长。他认为大模型性能差异已缩小至个位数,未来商业化关键在于企业私有大模型。SambaNova提出颠覆性观点:大型企业内部不会运行单一超大模型,而是根据不同业务场景创建150个参数超万亿的专家模型,形成”专家合成”架构。每个模型专注于特定领域(如法律、制造、风险管理等),通过软件路由器协同工作,这种分布式架构比GPT-4等集中式模型对企业更具实用价值。

SambaNova核心团队堪称学术界的明星阵容。三位创始人皆出身斯坦福:CEO Rodrigo Liang曾任职Sun/甲骨文工程部,CTO Kunle Olukotun是电气工程教授,开发出首批支持线程级推测的芯片;Christopher Ré是计算机科学副教授,专攻机器学习加速。团队中华人工程师占比极高,包括Jonathan Chang(特斯拉前员工)、Marshall Choy(甲骨文前高管)和Penny Li(IBM/甲骨文资深设计专家)等。从官网信息显示,至少3名华人高管在领导层。

SambaNova的AI引擎已正式上市,但具体定价尚未公布。Rodrigo Liang透露,8个SN40L组成的集群可处理5万亿参数,相当于70个700亿参数大模型,全球2000强企业只需两个这样的集群即可满足全部大模型需求。

最新快讯

2026年02月11日

19:08
微新创想:2026年2月11日 欧盟委员会宣布多项打击网络暴力新举措 欧盟委员会在2026年2月11日发布了一系列针对网络暴力的新政策。这些措施旨在解决影响欧盟六分之一儿童的网络暴力问题 并有效降低其对青少年心理健康造成的潜在威胁 新政策将加强《数字服务法》的实施力度 要求各大网络平台切实履行对未成年人的保护责任。其中包括提供一键屏蔽和静音功能 以及禁止在未...
19:08
微新创想:2026年2月11日,阿里巴巴在钉钉App 8.2.10版本中正式推出群聊专属AI智能体“AI小钉”。这一创新功能标志着钉钉在企业协作与智能化服务领域的进一步突破。 该功能面向内部群开放,新创建的群默认启用AI小钉,而已有的群则需要由群主或管理员在设置中手动添加配置。用户只需在群聊中@AI小钉,即可通过自然语言进行交互,实现多种智能化操作。 用户可...
18:38
微新创想:2026年2月11日,金海通(603061.SH)宣布拟在上海市青浦区华新镇投资建设“上海澜博半导体设备制造中心建设项目”,总投资额不超过4亿元。项目将建设总面积不超过5.5万平方米的生产研发综合基地,涵盖生产车间、综合办公楼及配套建筑,并购置先进设备。此举系公司基于战略发展与业务布局作出的审慎决策,旨在打造集生产、研发与办公于一体的半导体设备运营...
18:38
微新创想:2026年2月11日,立昂技术发布公告,其全资子公司立昂云数据(四川)有限公司拟以自有资金2120万元,认缴深圳星连荣基创业投资合伙企业(有限合伙)9.9995%的份额。该基金的主要投资方向为北京生数科技有限公司。此次投资标志着立昂技术在人工智能领域的进一步布局,有助于加强公司在该领域的技术协同能力,并拓展其产业生态。 此次投资是立昂技术推动战略转...
18:38
微新创想:2025年全球电动汽车市场迎来显著增长,各国产量数据展现不同发展态势。德国在这一年生产了122万台电动汽车,相比2024年实现了15%的同比增长,稳居全球第二的位置。与此同时,中国以1610万台的产量遥遥领先,成为全球最大的电动汽车生产国。美国则以104万台的产量位列第三,显示出其在新能源汽车领域的持续发展。 德国全年新车总产量达到415万台,其中...
18:38
微新创想:截至2月11日(农历腊月二十四,南方小年)全国铁路春运车票累计发售超过2亿张 全国铁路部门在春运期间持续加大运力投放力度 当日计划加开旅客列车1544列以满足旅客出行需求 2月10日全国铁路发送旅客人数达到1398.0万人次 与去年同期相比旅客发送量增长了4.9个百分点 铁路部门通过科学调度和严密组织确保运输安全有序进行 春运运输工作整体保持平稳态...
18:38
微新创想:2026年2月11日,中国平安人寿保险股份有限公司完成工商变更,注册资本由338亿元增至约360.03亿元,增幅约7%。此次增资由股东方共同推动,旨在增强资本实力与偿付能力。 公司成立于2002年12月,注册地为深圳,法定代表人为杨铮。作为中国平安集团旗下的重要子公司,中国平安人寿一直致力于提供全面的人身保险服务。 此次注册资本的增加不仅反映了股东...
18:38
微新创想:2026年2月11日,新锐股份发布公告,拟以不超过7亿元人民币的价格收购新乡市慧联电子科技股份有限公司70%的股权。此次交易标志着新锐股份在拓展精密制造领域的重要一步。 慧联电子是一家专注于PCB印制电路板专用钻针、铣刀等电子工模具的高新技术企业。其产品广泛应用于电子制造行业,具有较高的技术含量和市场竞争力。 通过此次收购,新锐股份将获得慧联电子的...
18:38
微新创想:2月7日,千问日活跃用户数达7352万, surpass元宝(1828万),接近豆包(7871万)。数据显示,其App自2月5日起已连续6天位列苹果App Store中国区免费榜第一。这一成绩标志着千问在用户中的受欢迎程度持续攀升,成为当前市场上最具竞争力的AI助手之一。 该增长发生于2026年春节假期后返工首周,反映用户对AI助手工具的高频使用需...
18:38
微新创想:2026年2月,武汉创现科技正式获得光谷产投、丹麓资本与瑞江资本联合发起的天使轮融资。此次融资标志着公司在智能硬件领域迈出了坚实的一步,也为其在家用机器人赛道的发展提供了强有力的支持。 公司专注于家用机器人领域,尤其在软表面自动清洁技术方面取得了重要突破。其主打产品是智能清洁机器人,能够一键启动,在床面、沙发等软质表面上自主运行,有效解决传统手动除...
18:38
微新创想:2月11日,镇江汉骑科技有限公司在江苏镇江正式注册成立。公司法定代表人为孙可青,注册资本达500万美元,由美团旗下Xigua Limited全资控股。这一新公司的设立标志着美团在区域技术研发和数据服务领域迈出了重要一步。 微新创想:镇江汉骑科技的经营范围广泛,涵盖软件开发、网络与信息安全软件开发、信息技术及信息咨询服务、互联网数据服务等多个方面。通...