高端GPU市场持续供不应求之际,一家挑战英伟达地位的新兴芯片初创公司成为行业焦点。独角兽企业SambaNova最新发布的AI芯片SN40L,仅凭8枚芯片即可支持高达5万亿参数的大模型——这一规模是GPT-4的三倍。型号中的”40″代表第四代产品,”L”则专指针对大语言模型(LLM)的深度优化:配备1.5TB内存,支持25.6万个token的序列长度。CEO Rodrigo Liang强调,采用他们方案运行万亿参数大模型的总拥有成本仅为行业标准的1/25。

SambaNova目前估值50亿美元(约365亿人民币),累计完成6轮总计11亿美元的融资,投资方阵容堪称豪华,包括英特尔、软银、三星、GV等业界巨头。这家公司不仅在芯片技术层面要挑战英伟达,其业务模式更计划超越竞争对手:直接参与企业私有大模型的训练服务。其目标客户群雄心勃勃——瞄准全球前2000家企业。

最新产品SN40L采用台积电5纳米工艺制造,集成1020亿晶体管,峰值速度达638TeraFLOPS。与英伟达H100(80GB HBM3)和AMD MI300(192GB HBM3)等竞品不同,SN40L创新性地采用了三层Dataflow内存系统:520MB片上SRAM、65GB高带宽HBM3内存,以及高达1.5TB的外部DRAM内存。虽然HBM3容量不及对手,但SambaNova通过专用软件编译器智能分配三层内存负载,并可将8个芯片虚拟为单一系统。

在硬件层面,SN40L还针对大模型特性开发了混合计算加速方案。团队发现大模型中大量权重参数为0,将计算资源用于这些无效操作效率极低。为此,他们研发了软件层面的加速技术,优化调度与数据传输流程,但具体实现细节尚未公开。Gartner分析师Chirag Dekate指出,SN40L可能在大模型多模态应用上具有优势,其硬件架构比传统GPU更灵活,能更好地处理图像、视频、文本等多样化数据。

目前SambaNova已获得多家重量级客户,包括日本富岳、美国阿贡与劳伦斯国家实验室等顶尖超算中心,以及埃森哲等咨询巨头。其商业模式颇具特色——不单独销售芯片,而是提供从芯片到服务器系统的定制技术栈,甚至包括大模型部署服务。为此,公司与TogetherML合作开发了BloomChat,一个基于BigScience开源模型Bloom的1760亿参数多语言聊天大模型,该模型在OpenChatKit、Dolly2.0和OASST1数据集上进行了微调,训练过程全程使用SambaNova独特的数据流架构。

在与The Next Platform的交流中,Rodrigo Liang表示当前公开数据集已接近枯竭,但企业对参数规模的需求仍在持续增长。他认为大模型性能差异已缩小至个位数,未来商业化关键在于企业私有大模型。SambaNova提出颠覆性观点:大型企业内部不会运行单一超大模型,而是根据不同业务场景创建150个参数超万亿的专家模型,形成”专家合成”架构。每个模型专注于特定领域(如法律、制造、风险管理等),通过软件路由器协同工作,这种分布式架构比GPT-4等集中式模型对企业更具实用价值。

SambaNova核心团队堪称学术界的明星阵容。三位创始人皆出身斯坦福:CEO Rodrigo Liang曾任职Sun/甲骨文工程部,CTO Kunle Olukotun是电气工程教授,开发出首批支持线程级推测的芯片;Christopher Ré是计算机科学副教授,专攻机器学习加速。团队中华人工程师占比极高,包括Jonathan Chang(特斯拉前员工)、Marshall Choy(甲骨文前高管)和Penny Li(IBM/甲骨文资深设计专家)等。从官网信息显示,至少3名华人高管在领导层。

SambaNova的AI引擎已正式上市,但具体定价尚未公布。Rodrigo Liang透露,8个SN40L组成的集群可处理5万亿参数,相当于70个700亿参数大模型,全球2000强企业只需两个这样的集群即可满足全部大模型需求。

最新快讯

2026年02月11日

21:28
微新创想:2026年2月11日,安世半导体对外表示,尽管当前面临外部环境挑战,公司核心业务运营依然保持稳健。事件发生于荷兰奈梅亨总部,由公司管理层在例行经营通报中披露。此举旨在回应市场对其供应链稳定性及业绩持续性的关切。 微新创想:公司强调,产能利用率、客户订单交付率及研发投入均维持在健康水平,未出现重大波动。相关表态未涉及具体财务数据,但表明其正通过优化产...
21:28
微新创想:2026年2月11日 美国电信运营商T-Mobile公布2025年第四季度财报数据显示 其后付费用户净增238万 显著高于市场预估的192万 该数据反映公司在激烈市场竞争中持续提升用户获取与留存能力 增长主要来自5G套餐推广 融合业务拓展及竞对用户迁移 公司未披露具体地域分布 但强调全美范围内宽带与移动服务协同拉动效应明显 此次表现提振市场对其20...
21:28
微新创想:2026年2月11日深夜,北京智谱AI正式发布新一代开源旗舰大模型GLM-5。该模型在代码生成(Coding)与智能体(Agent)能力上达到当前开源模型最优水平(SOTA)。 GLM-5在真实编程场景中的体验接近Claude Opus 4.5,尤其擅长处理复杂系统工程与长程Agent任务。这使得它在实际应用中展现出强大的解决问题能力和高效的工作流...
21:28
微新创想:优刻得于2026年2月11日发布公告宣布将对云产品和服务进行价格调整。公告指出由于全球供应链波动加剧以及核心硬件采购成本显著上升,公司决定自2026年3月1日起对所有续签及新签用户实施全线云产品与服务的价格上调。此次调价涵盖了计算、存储、网络和安全等多个主要服务类别。 此次价格调整仅适用于新签及续签用户,不涉及现有合同未到期用户的存量计费周期。这意...
21:28
微新创想:Epic Games宣布自2026年2月19日起《堡垒之夜》PC端所有赛事将强制启用Secure Boot、TPM及IOMMU安全功能 Epic Games近日发布官方公告表示将在2026年2月19日之后对《堡垒之夜》PC端赛事实施新的安全措施 所有PC端赛事将要求玩家启用Secure Boot、TPM及IOMMU等安全功能 这些功能旨在防止外接设...
21:28
微新创想:2026年2月11日 本田宣布暂停多款电动汽车研发项目 并结束与通用汽车的电动车合作 截至2025年12月31日的9个月内 其电动车业务计提减值等费用达2671亿日元(约119.51亿元人民币) 前三季度累计营业亏损1664亿日元(约74.45亿元人民币) 公司承认对全球电动车需求判断过于乐观 将显著调整电动化战略 重心转向混动技术 目标2026年...
20:58
微新创想:2026年2月17日,PlayStation Plus Extra与Premium会员将可游玩《漫威蜘蛛侠2》《无限试驾:太阳王冠》及《Neva》。这一消息由爆料人billbil-kun提前披露,引发玩家广泛关注。三款游戏均支持PS5平台,其中《Neva》还兼容PS4,确保更多玩家能够体验。索尼计划在2月13日6时举行State of Play发布...
20:58
微新创想:2026年2月11日,Counterpoint Research发布最新《高端电视显示面板成本报告》。报告显示,2026年130英寸UHD LCD模块成本约为116英寸的1.5倍;IJP OLED虽材料成本更低,但因新产线折旧高,综合成本暂无优势;QD-OLED良率提升超预期,但受折旧与SG&A拖累,成本仍比同尺寸WOLED高60%–65%...
20:24
微新创想:2026年2月11日,中国南方航空接收第九架国产C919飞机并正式投入运营,首航执飞广州至西安航线。这标志着南航在国产大飞机运营方面迈出了坚实一步,进一步丰富了其机队结构。 该机将于春运期间每日执行长沙黄花机场至北京大兴机场2个往返航班,分别为CZ3717/CZ3718和CZ3147/CZ6137。这一安排不仅提升了航线的运力,也为旅客提供了更多便...
20:24
微新创想:2026年2月11日 爆料人Evan Blass公布联想moto Edge 70 Fusion官方海报 该机将于近期发布 提供乡村空气 冲浪蓝 运动绿 东方蓝和剪影五种潘通认证配色 手机采用曲面屏设计 后置三摄 搭载骁龙7s Gen 3处理器 最高12GB RAM+256GB存储 内置7000mAh电池 支持68W有线快充 具体上市时间与售价尚未公...
20:24
微新创想:2026年2月,保时捷在瑞典北部和德国偏远地区启动了2028款Panamera的测试工作。此次测试涉及两辆经过伪装的测试车辆,它们均配备了全新的倾斜式格栅设计,进一步强化了前脸的视觉冲击力。同时,新车还采用了更新的Matrix LED灯组,提升了照明效果与辨识度。 微新创想:在安全辅助系统方面,2028款Panamera将搭载与纯电Macan同款的...
20:24
微新创想:2026年2月11日,曜越正式发布新款49英寸曲面带鱼屏显示器TGM-V49CDQ 这款显示器采用了5120×1440的高分辨率设计,为用户带来更加细腻的视觉体验。240Hz的刷新率确保了画面的流畅性,特别适合对帧率要求较高的游戏和视频编辑场景。Fast VA面板不仅提升了色彩表现力,还优化了对比度和视角,让屏幕在不同角度下依然保持出色的显示效果 ...