高端GPU市场持续供不应求之际,一家挑战英伟达地位的新兴芯片初创公司成为行业焦点。独角兽企业SambaNova最新发布的AI芯片SN40L,仅凭8枚芯片即可支持高达5万亿参数的大模型——这一规模是GPT-4的三倍。型号中的”40″代表第四代产品,”L”则专指针对大语言模型(LLM)的深度优化:配备1.5TB内存,支持25.6万个token的序列长度。CEO Rodrigo Liang强调,采用他们方案运行万亿参数大模型的总拥有成本仅为行业标准的1/25。

SambaNova目前估值50亿美元(约365亿人民币),累计完成6轮总计11亿美元的融资,投资方阵容堪称豪华,包括英特尔、软银、三星、GV等业界巨头。这家公司不仅在芯片技术层面要挑战英伟达,其业务模式更计划超越竞争对手:直接参与企业私有大模型的训练服务。其目标客户群雄心勃勃——瞄准全球前2000家企业。

最新产品SN40L采用台积电5纳米工艺制造,集成1020亿晶体管,峰值速度达638TeraFLOPS。与英伟达H100(80GB HBM3)和AMD MI300(192GB HBM3)等竞品不同,SN40L创新性地采用了三层Dataflow内存系统:520MB片上SRAM、65GB高带宽HBM3内存,以及高达1.5TB的外部DRAM内存。虽然HBM3容量不及对手,但SambaNova通过专用软件编译器智能分配三层内存负载,并可将8个芯片虚拟为单一系统。

在硬件层面,SN40L还针对大模型特性开发了混合计算加速方案。团队发现大模型中大量权重参数为0,将计算资源用于这些无效操作效率极低。为此,他们研发了软件层面的加速技术,优化调度与数据传输流程,但具体实现细节尚未公开。Gartner分析师Chirag Dekate指出,SN40L可能在大模型多模态应用上具有优势,其硬件架构比传统GPU更灵活,能更好地处理图像、视频、文本等多样化数据。

目前SambaNova已获得多家重量级客户,包括日本富岳、美国阿贡与劳伦斯国家实验室等顶尖超算中心,以及埃森哲等咨询巨头。其商业模式颇具特色——不单独销售芯片,而是提供从芯片到服务器系统的定制技术栈,甚至包括大模型部署服务。为此,公司与TogetherML合作开发了BloomChat,一个基于BigScience开源模型Bloom的1760亿参数多语言聊天大模型,该模型在OpenChatKit、Dolly2.0和OASST1数据集上进行了微调,训练过程全程使用SambaNova独特的数据流架构。

在与The Next Platform的交流中,Rodrigo Liang表示当前公开数据集已接近枯竭,但企业对参数规模的需求仍在持续增长。他认为大模型性能差异已缩小至个位数,未来商业化关键在于企业私有大模型。SambaNova提出颠覆性观点:大型企业内部不会运行单一超大模型,而是根据不同业务场景创建150个参数超万亿的专家模型,形成”专家合成”架构。每个模型专注于特定领域(如法律、制造、风险管理等),通过软件路由器协同工作,这种分布式架构比GPT-4等集中式模型对企业更具实用价值。

SambaNova核心团队堪称学术界的明星阵容。三位创始人皆出身斯坦福:CEO Rodrigo Liang曾任职Sun/甲骨文工程部,CTO Kunle Olukotun是电气工程教授,开发出首批支持线程级推测的芯片;Christopher Ré是计算机科学副教授,专攻机器学习加速。团队中华人工程师占比极高,包括Jonathan Chang(特斯拉前员工)、Marshall Choy(甲骨文前高管)和Penny Li(IBM/甲骨文资深设计专家)等。从官网信息显示,至少3名华人高管在领导层。

SambaNova的AI引擎已正式上市,但具体定价尚未公布。Rodrigo Liang透露,8个SN40L组成的集群可处理5万亿参数,相当于70个700亿参数大模型,全球2000强企业只需两个这样的集群即可满足全部大模型需求。

最新快讯

2025年10月30日

06:15
2025年10月30日,科技巨头Meta的CEO马克·扎克伯格在一场重要会议上公开表示,公司对计算能力的需求正以远超预期的速度增长。这一消息揭示了Meta在人工智能和元宇宙等前沿领域的雄心壮志。扎克伯格强调,充足的算力资源是推动公司业务增长和盈利能力提升的关键因素。他直言不讳地指出,若能获得更多可用的计算能力,Meta将能够显著优化其AI模型的训练效率,加速...
06:15
2025年10月30日,在一场备受瞩目的行业峰会上,Meta首席执行官马克·扎克伯格就公司人工智能产品的商业化问题发表了重要观点。他明确表示,现阶段讨论AI产品的盈利模式还为时过早,因为Meta当前的核心任务是推动AI技术的持续创新与深度布局。扎克伯格强调,公司正将所有资源集中于两大关键领域——一是通过技术创新显著提升用户交互体验,二是构建更为完善的基础设施...
06:15
2025年10月30日,美国科技巨头Meta发布重要声明,正式宣布将大幅增加资本投入,以加速人工智能技术的研发与应用进程。公司高层表示,面对人工智能领域的激烈竞争,Meta计划在未来几年内显著提升在数据中心建设、研发团队扩充以及基础设施升级方面的资金配置。这一战略举措的核心目标在于抢占生成式AI和社交平台智能化的市场先机,进一步巩固其在全球科技行业的领先地位...
05:37
2025年9月,Meta AI创新性地推出了Vibes功能,这一举措迅速点燃了用户创作热情,导致应用内媒体生成量实现了惊人的10倍增长。这一关键数据由Meta首席财务官在10月30日的重要会议上首次披露,有力地证明了Vibes功能在激发用户内容创作活力方面的卓越成效。 Vibes功能的核心优势在于其强大的AI生成能力,通过智能算法的深度优化,显著提升了图...
05:37
2025年10月30日,微软首席执行官在公开场合郑重宣布,公司将继续加大对人工智能领域的资本与人才投入力度。这一战略决策充分展现了微软对人工智能技术未来发展的深刻洞察,以及把握行业变革机遇的决心。面对人工智能技术的迅猛发展,微软认为这不仅是挑战,更是企业实现跨越式增长的重大机遇。微软CEO的表态,无疑为整个行业注入了新的信心,也彰显了微软在AI领域的长期战略...
01:57
2025年10月30日,美国地区用户遭遇谷歌服务大规模访问中断,DownDetector监测数据显示,当日上午大量用户反馈搜索、Gmail及云端硬盘等核心服务异常。此次故障波及范围广泛,用户报告问题集中在太平洋时间上午时段,部分用户甚至无法登录账户或访问特定功能。值得注意的是,谷歌官方尚未就此事件发布任何官方声明,引发市场广泛关注。目前技术团队已介入调查,但...
01:57
2025年10月30日,欧洲航空防务集团空客正式发布了其第三季度的财务报告,整体营收表现超出市场预期。财报显示,空客在本季度实现了178.3亿欧元的营收,较市场此前预测的174.5亿欧元高出3.8亿欧元,展现出强劲的市场竞争力。在盈利能力方面,调整后的EBIT(息税折旧摊销前利润)达到19.4亿欧元,不仅超越了市场预期的17.1亿欧元,更体现了公司卓越的运营...
00:52
2025年10月29日,全球领先的铜生产商南方铜业正式发布其未来资本支出计划,预计2026年度资本投入将达到约20亿美元。这一雄心勃勃的投资方案将重点投向产能扩张和矿山开发两大核心领域,旨在通过技术升级与资源整合,全面提升公司的生产效率与市场竞争力。 南方铜业表示,此次大规模资本投入的核心目标之一是加速实现其长期战略规划。公司明确将目标锁定在2030年代...
00:52
2025年10月30日,沙特主权财富基金PIF正式公布其未来发展战略,将集中资源打造六大核心产业生态系统。这一前瞻性计划全面覆盖旅游观光与娱乐体验、城市开发与宜居环境建设、高端制造与创新科技应用、工业物流体系现代化升级,以及清洁能源与可再生基础设施发展等关键领域。作为沙特经济转型的重要举措,该计划的核心目标在于推动经济多元化发展,逐步降低对石油产业的依赖,从...
00:52
2025年第四季度,南方铜业公司传来积极信号,预计铜产量将迎来局部性恢复。公司方面透露,通过实施精细化生产流程优化和设备维护升级方案,部分矿区的产能正逐步回升。此次产能恢复主要集中在运营条件得到显著改善的特定矿区,显示出公司对生产效率提升的坚定决心。 与此同时,南方铜业还宣布了降本增效的阶段性目标,预计现金成本将有效降低,整体运营效率得到显著提升。这一系...
00:10
2025年10月29日,通用汽车公司正式宣布了一项重大人事调整计划,将大幅裁减底特律电动车工厂的岗位数量,总计高达1200个。与此同时,位于田纳西州和俄亥俄州的电池生产工厂也将进行数百人的裁员。这一系列裁员措施主要聚焦于电动车型及电池制造部门,其核心目标在于通过优化成本结构,进一步调整和优化产能布局,以适应市场变化和公司战略需求。 通用汽车在公告中强调,对于...
00:10
北京现代全新纯电紧凑型SUV EO羿欧今日正式揭开神秘面纱,正式公布指导价11.98万元起,为消费者带来前所未有的电动出行体验。这款备受瞩目的新车不仅拥有极具吸引力的价格,更在续航能力、科技配置和设计美学上实现了全面突破,成为同级市场中不可多得的实力之选。 新车提供三种不同续航版本,充分满足不同用户的出行需求。其中CLTC标准下最长续航版本达到了惊人的722...