高端GPU市场持续供不应求之际,一家挑战英伟达地位的新兴芯片初创公司成为行业焦点。独角兽企业SambaNova最新发布的AI芯片SN40L,仅凭8枚芯片即可支持高达5万亿参数的大模型——这一规模是GPT-4的三倍。型号中的”40″代表第四代产品,”L”则专指针对大语言模型(LLM)的深度优化:配备1.5TB内存,支持25.6万个token的序列长度。CEO Rodrigo Liang强调,采用他们方案运行万亿参数大模型的总拥有成本仅为行业标准的1/25。

SambaNova目前估值50亿美元(约365亿人民币),累计完成6轮总计11亿美元的融资,投资方阵容堪称豪华,包括英特尔、软银、三星、GV等业界巨头。这家公司不仅在芯片技术层面要挑战英伟达,其业务模式更计划超越竞争对手:直接参与企业私有大模型的训练服务。其目标客户群雄心勃勃——瞄准全球前2000家企业。

最新产品SN40L采用台积电5纳米工艺制造,集成1020亿晶体管,峰值速度达638TeraFLOPS。与英伟达H100(80GB HBM3)和AMD MI300(192GB HBM3)等竞品不同,SN40L创新性地采用了三层Dataflow内存系统:520MB片上SRAM、65GB高带宽HBM3内存,以及高达1.5TB的外部DRAM内存。虽然HBM3容量不及对手,但SambaNova通过专用软件编译器智能分配三层内存负载,并可将8个芯片虚拟为单一系统。

在硬件层面,SN40L还针对大模型特性开发了混合计算加速方案。团队发现大模型中大量权重参数为0,将计算资源用于这些无效操作效率极低。为此,他们研发了软件层面的加速技术,优化调度与数据传输流程,但具体实现细节尚未公开。Gartner分析师Chirag Dekate指出,SN40L可能在大模型多模态应用上具有优势,其硬件架构比传统GPU更灵活,能更好地处理图像、视频、文本等多样化数据。

目前SambaNova已获得多家重量级客户,包括日本富岳、美国阿贡与劳伦斯国家实验室等顶尖超算中心,以及埃森哲等咨询巨头。其商业模式颇具特色——不单独销售芯片,而是提供从芯片到服务器系统的定制技术栈,甚至包括大模型部署服务。为此,公司与TogetherML合作开发了BloomChat,一个基于BigScience开源模型Bloom的1760亿参数多语言聊天大模型,该模型在OpenChatKit、Dolly2.0和OASST1数据集上进行了微调,训练过程全程使用SambaNova独特的数据流架构。

在与The Next Platform的交流中,Rodrigo Liang表示当前公开数据集已接近枯竭,但企业对参数规模的需求仍在持续增长。他认为大模型性能差异已缩小至个位数,未来商业化关键在于企业私有大模型。SambaNova提出颠覆性观点:大型企业内部不会运行单一超大模型,而是根据不同业务场景创建150个参数超万亿的专家模型,形成”专家合成”架构。每个模型专注于特定领域(如法律、制造、风险管理等),通过软件路由器协同工作,这种分布式架构比GPT-4等集中式模型对企业更具实用价值。

SambaNova核心团队堪称学术界的明星阵容。三位创始人皆出身斯坦福:CEO Rodrigo Liang曾任职Sun/甲骨文工程部,CTO Kunle Olukotun是电气工程教授,开发出首批支持线程级推测的芯片;Christopher Ré是计算机科学副教授,专攻机器学习加速。团队中华人工程师占比极高,包括Jonathan Chang(特斯拉前员工)、Marshall Choy(甲骨文前高管)和Penny Li(IBM/甲骨文资深设计专家)等。从官网信息显示,至少3名华人高管在领导层。

SambaNova的AI引擎已正式上市,但具体定价尚未公布。Rodrigo Liang透露,8个SN40L组成的集群可处理5万亿参数,相当于70个700亿参数大模型,全球2000强企业只需两个这样的集群即可满足全部大模型需求。

最新快讯

2025年08月13日

21:17
2025年8月13日,资本市场迎来一系列重磅消息,多家上市公司纷纷发布重大公告,引发市场广泛关注。芯碁微装宣布正式启动H股发行计划,并正式向香港联交所递交上市申请,此举标志着该公司加速国际化布局,有望进一步提升品牌影响力。与此同时,长城军工发布紧急公告,表示若股价持续快速上涨,将可能申请停牌接受监管核查,以维护市场公平交易秩序。 在退市机制方面,*ST天茂成...
21:17
2025年8月13日,北京时间,科技界迎来重磅消息:OpenAI联合创始人Sam Altman将携手公司共同注资2.5亿美元,鼎力支持脑机接口领域的创新先锋Merge Labs。这一战略投资不仅彰显了资本市场对脑机接口技术的热忱,更标志着该领域竞争格局的加剧,因为Merge Labs正是马斯克旗下Neuralink的强劲对手。 作为新兴的科技企业,Merge...
21:17
2025年8月13日,北京时间凌晨,美国半导体巨头AMD的股价在盘前交易中强势上涨3%,展现出强劲的市场信心。这一显著涨幅不仅延续了近期股价的积极趋势,更反映出投资者对AMD近期业绩表现及行业整体动态的高度认可。值得注意的是,此次股价的持续攀升似乎与公司近期发布的技术突破或市场策略调整存在关联,但具体推动因素仍需等待公司进一步披露详细信息。市场分析人士普遍认...
21:17
2025年8月13日,北京时间,美国知名网络安全公司Palo Alto Networks的股价在盘前交易中表现强劲,涨幅超过2%。这一积极的市场反应主要得益于德意志银行对其股票的最新评级调整。该投行将Palo Alto Networks的股票评级从之前的“持有”果断上调至“买入”,这一举措被视为刺激股价上涨的关键因素。德意志银行的评级上调基于对公司未来增长潜...
21:17
2025年8月13日,博源化工(股票代码:000683)在官方互动平台发布重要消息,宣布公司位于阿拉善的天然碱项目二期工程已进入关键收尾阶段,预计将于今年年底完成建设并正式启动投料试车。这一进展标志着博源化工在化工资源开发领域再添新里程碑。据悉,该项目自启动以来始终严格遵循既定施工计划,各部门协同高效,确保工程进度稳步推进,目前各项建设任务已基本完成,为即将...
21:17
8月13日,隆华新材正式发布控股股东减持公告,引发市场广泛关注。公告显示,公司董事长韩志刚计划在未来15个交易日结束后3个月内,通过集中竞价交易方式减持公司股份,减持数量上限为430万股,占公司总股本的1%。韩志刚同时担任公司控股股东及实际控制人之一,此次减持行为主要出于个人资金需求考虑。 公告强调,此次减持计划不会对公司治理结构产生实质性影响,也不会对公司...
21:17
中电鑫龙(002298.SZ)董事束龙胜近期因个人资金需求,于7月18日至8月12日期间,通过集中竞价交易方式减持公司股份609.2万股。此次减持规模占公司总股本的0.82%,体现了公司管理层在个人财务规划与公司发展之间的平衡考量。 减持完成后,束龙胜仍持有公司股份2751.3万股,占比3.72%,其作为公司董事的持股比例保持稳定。这一操作不仅满足了个人资金...
21:17
2025年8月13日,冰山冷热正式发布其2025年半年业绩报告,揭示了公司上半年的经营成果与战略进展。报告显示,公司上半年实现营业收入24.01亿元,较去年同期下降2.52%,但归属于上市公司股东的净利润达到7954.11万元,同比增长1.29%,展现出稳健的盈利能力与市场韧性。 在技术创新方面,降膜式开启螺杆冷水机组经过严格的实际应用检验后成功批量推向市场...
21:17
2025年8月13日,美国农业部发布最新报告,将2025-26年度美国国内大豆产量预估下调至43亿蒲式耳,这一调整主要归因于播种面积的缩减。产量预期的下调直接影响了市场对大豆库存的预期,最终预估数据低于市场所有调查机构的预测。受此消息影响,芝加哥商品交易所的大豆期货价格出现显著上涨,活跃合约盘中一度攀升至0.9%,创下自7月中旬以来的最高点,并连续第三个交易...
21:17
安联锐视最新公告揭示重要股东减持计划 近日,安联锐视正式发布公告,披露了股东联众永盛及徐进的减持计划。根据公告内容,这两位股东计划合计减持公司股份,减持比例将严格控制在总股本的1.42%以内。此次减持将采取集中竞价交易或大宗交易两种方式进行,确保减持过程的规范性和透明度。 公告明确指出,股东减持的主要原因是出于自身资金需求。这一解释体现了资本市场中股东根据自...
21:17
2025年8月13日,洪通燃气正式发布官方公告,就公司当前核心业务运营状况作出权威说明。公告明确指出,公司目前的主营业务范围涵盖液化天然气(LNG)、压缩天然气(CNG)的生产加工、储存运输以及销售环节,同时业务范围还延伸至居民用、商业用和工业用天然气的销售服务。作为行业重要参与者,洪通燃气此次公告的核心内容在于强调其主营业务及日常生产经营活动保持高度稳定性...
20:14
8月13日,上市公司利君股份正式发布重要公告,披露了股东魏勇及其一致行动人未来三个月的减持计划。根据公告内容,相关股东计划在15个交易日后的3个月内,通过两种主要方式减持公司股份。其中,集中竞价方式减持的股份上限为1033.46万股,占公司总股本比例不超过1%;大宗交易方式减持的股份上限则高达2066.92万股,占公司总股本比例不超过2%。此次减持计划严格遵...