高端GPU市场持续供不应求之际,一家挑战英伟达地位的新兴芯片初创公司成为行业焦点。独角兽企业SambaNova最新发布的AI芯片SN40L,仅凭8枚芯片即可支持高达5万亿参数的大模型——这一规模是GPT-4的三倍。型号中的”40″代表第四代产品,”L”则专指针对大语言模型(LLM)的深度优化:配备1.5TB内存,支持25.6万个token的序列长度。CEO Rodrigo Liang强调,采用他们方案运行万亿参数大模型的总拥有成本仅为行业标准的1/25。

SambaNova目前估值50亿美元(约365亿人民币),累计完成6轮总计11亿美元的融资,投资方阵容堪称豪华,包括英特尔、软银、三星、GV等业界巨头。这家公司不仅在芯片技术层面要挑战英伟达,其业务模式更计划超越竞争对手:直接参与企业私有大模型的训练服务。其目标客户群雄心勃勃——瞄准全球前2000家企业。

最新产品SN40L采用台积电5纳米工艺制造,集成1020亿晶体管,峰值速度达638TeraFLOPS。与英伟达H100(80GB HBM3)和AMD MI300(192GB HBM3)等竞品不同,SN40L创新性地采用了三层Dataflow内存系统:520MB片上SRAM、65GB高带宽HBM3内存,以及高达1.5TB的外部DRAM内存。虽然HBM3容量不及对手,但SambaNova通过专用软件编译器智能分配三层内存负载,并可将8个芯片虚拟为单一系统。

在硬件层面,SN40L还针对大模型特性开发了混合计算加速方案。团队发现大模型中大量权重参数为0,将计算资源用于这些无效操作效率极低。为此,他们研发了软件层面的加速技术,优化调度与数据传输流程,但具体实现细节尚未公开。Gartner分析师Chirag Dekate指出,SN40L可能在大模型多模态应用上具有优势,其硬件架构比传统GPU更灵活,能更好地处理图像、视频、文本等多样化数据。

目前SambaNova已获得多家重量级客户,包括日本富岳、美国阿贡与劳伦斯国家实验室等顶尖超算中心,以及埃森哲等咨询巨头。其商业模式颇具特色——不单独销售芯片,而是提供从芯片到服务器系统的定制技术栈,甚至包括大模型部署服务。为此,公司与TogetherML合作开发了BloomChat,一个基于BigScience开源模型Bloom的1760亿参数多语言聊天大模型,该模型在OpenChatKit、Dolly2.0和OASST1数据集上进行了微调,训练过程全程使用SambaNova独特的数据流架构。

在与The Next Platform的交流中,Rodrigo Liang表示当前公开数据集已接近枯竭,但企业对参数规模的需求仍在持续增长。他认为大模型性能差异已缩小至个位数,未来商业化关键在于企业私有大模型。SambaNova提出颠覆性观点:大型企业内部不会运行单一超大模型,而是根据不同业务场景创建150个参数超万亿的专家模型,形成”专家合成”架构。每个模型专注于特定领域(如法律、制造、风险管理等),通过软件路由器协同工作,这种分布式架构比GPT-4等集中式模型对企业更具实用价值。

SambaNova核心团队堪称学术界的明星阵容。三位创始人皆出身斯坦福:CEO Rodrigo Liang曾任职Sun/甲骨文工程部,CTO Kunle Olukotun是电气工程教授,开发出首批支持线程级推测的芯片;Christopher Ré是计算机科学副教授,专攻机器学习加速。团队中华人工程师占比极高,包括Jonathan Chang(特斯拉前员工)、Marshall Choy(甲骨文前高管)和Penny Li(IBM/甲骨文资深设计专家)等。从官网信息显示,至少3名华人高管在领导层。

SambaNova的AI引擎已正式上市,但具体定价尚未公布。Rodrigo Liang透露,8个SN40L组成的集群可处理5万亿参数,相当于70个700亿参数大模型,全球2000强企业只需两个这样的集群即可满足全部大模型需求。

最新快讯

2025年08月14日

11:10
谷歌母公司Alphabet近日正式宣布一项雄心勃勃的计划,将在未来两年内向俄克拉荷马州注入高达90亿美元的资金,旨在全面升级其云计算和人工智能(AI)基础设施。这一战略投资的核心将聚焦于新建大型数据中心园区,同时显著扩大在斯蒂尔沃特和普赖尔等关键地区的现有设施规模。作为美国科技产业的重要布局,此次扩建不仅将极大提升美国在全球云计算和人工智能领域的综合竞争力,...
11:10
谷歌近日正式宣布,将为其备受青睐的 Google Slides 和 Google Vids 平台注入两项革命性的 AI 图像编辑功能,这些创新功能均基于强大的 Gemini 人工智能技术,旨在彻底革新用户处理图像背景的体验。无论是需要彻底替换背景,还是希望扩展图像的视觉范围,这些新功能都能让操作变得前所未有的简单快捷。 首项功能聚焦于背景的智能替换。用户只需...
11:10
南京公交智能化升级成果斐然,市民出行体验显著提升,线路便捷性与交通效率大幅改善。近日,南京公交集团携手蚂蚁数科正式启动公交线网二期升级计划,共同打造"公交线网优化智能体"。这一创新举措标志着国内首次将"AI智能体"技术深度应用于公共交通调度系统,通过站点客流、线路等多维度数据分析,实现从传统"经验决策"到现代"智能规划"的全面转型。针对"晚高峰增车""线路调...
11:10
AIbase最新报道 8月14日至17日,北京国家速滑馆将迎来一场空前的科技盛事——全球首届世界人形机器人运动会。本次赛事吸引了280支参赛队伍,创下历史新高,经过严格审核最终确认参赛队伍数量。这些队伍涵盖了国内外顶尖的人形机器人研发企业、高校研究团队以及国际劲旅,共同上演一场科技与智慧的巅峰对决。 在参赛企业方面,宇树科技、星海图、天工智能、加速进化、松延...
11:10
人工智能安全领域的领军企业Anthropic近日宣布完成对AI工具平台Humanloop核心团队的战略性收购,此举标志着该公司在企业市场战略布局上的重大突破。尽管交易细节尚未公开披露,但此次收购清晰地展现了科技行业在人工智能人才争夺战中日益普遍的"人才收购"策略。Humanloop的三位联合创始人——CEO Raza Habib、CTO Peter Haye...
11:03
先锋基金近日正式发布增资公告,宣布公司注册资本实现重大突破,从原有的2.05亿元大幅提升至2.3亿元。这一关键性战略举措已获得股东会的一致审议通过,彰显了公司稳健发展的决心与信心。 本次增资的核心动力来自于股东北京指南针科技发展股份有限公司的鼎力支持。该股东以2.151亿元的巨额投资,成功将持股比例提升至93.53%,成为公司绝对控股股东。这一举措不仅为先锋...
11:02
近日,备受社会关注的老人离世前转账纠纷案迎来最终裁决。这起案件不仅牵动着无数网友的心,更引发了关于亲情、信任与法律边界的深刻思考。被告小刘曾无私照顾年过八旬的张大爷夫妇长达四年,却在老人临终前的一笔转账引发轩然大波,最终法院的公正判决为这场家庭纷争画上了句号。 张大爷夫妇育有一子小张,然而这个本该尽孝的年轻人却常年疏于陪伴。据调查,小张一年到头探望老人的次数...
11:02
近日江苏淮安发生了一起令人既揪心又庆幸的意外事件。凌晨2点时分,赵女士从睡梦中惊醒,赫然发现家中大门敞开,5岁的女儿竟不翼而飞。这一幕让赵女士瞬间心急如焚,她立刻起身查看家中监控录像,画面清晰地显示孩子独自一人走出了家门。确认女儿失踪后,赵女士和家人立即启动应急方案,分头在小区内展开地毯式搜索。经过紧张的搜寻,最终在小区中心的人工湖畔发现了失踪的小女孩。令人...
11:02
近日,福建某医院急诊科迎来了一位备受关注的特殊患者——28岁的林女士。她是在众多网友的紧急呼吁下,连夜赶赴医院检查膝盖伤口的。这一事件背后,隐藏着一段令人揪心的经历。 事情要从8月12日晚上说起。林女士在短视频平台上发布了一条求助视频,视频中她展示了自己膝盖处约5厘米的伤口。尽管伤口已经结痂,但痂皮表面却覆盖着细密的白色纤维状物质,部分区域甚至呈现絮状分布。...
11:02
近日,一位27岁的克罗恩病患者引发社会广泛关注,他一边与病魔顽强抗争,一边靠送外卖维持生计,其坚韧不拔的精神令人深受感动。这位年轻患者已被克罗恩病折磨了整整9年,由于免疫系统异常攻击消化系统,他无法正常进食,只能依靠营养液和少量食物维持生命。由于频繁腹泻,他不得不穿着尿不湿坚持送外卖,这份坚持令人敬佩。谈及收入,这位小伙无奈表示,受身体状况限制,送外卖的次数...
11:02
近日,广州白云法院对一起恶意拨打“110”报警电话的案件作出宣判,被告人蔡某因犯扰乱国家机关工作秩序罪,被判处有期徒刑十个月,该判决现已正式生效。这起案件的审理结果向社会传递了一个明确信号:恶意骚扰报警行为将受到法律的严惩。 2024年2月,蔡某利用电话号码A连续拨打110报警电话高达99次,其行为立即引起了公安机关的注意。随后,蔡某被刑事拘留,但很快转为取...
11:02
8月13日,日本音乐界笼罩在一片悲伤之中,一则令人痛心的消息传遍了各大媒体:备受尊敬的歌手山田信夫(NoB),这位为动画《圣斗士星矢》献唱经典主题曲《天马座幻想》的音乐人,于8月9日午后因肾脏癌不幸离世,享年61岁。他的骤然离去,不仅让无数音乐爱好者扼腕叹息,更让《圣斗士星矢》的铁杆粉丝陷入深深的怀念与悲痛之中。 据山田信夫的事务所发布的讣告显示,这位才华横...