编者按:本文来自微信公众号硅兔赛跑(ID:sv_race),作者:Vivek Ramaswami & Sabrina Wu,编辑:Lexie, Kathy,微新创想经授权转载。Snowflake和Databricks作为数据库领域的双雄,长期在同一赛道竞技却鲜有正面交锋。而生成式AI浪潮的兴起,让这两家巨头纷纷通过收购布局,Snowflake斥资收购Neeva(企业级AI搜索引擎),Databricks以13亿美元收购MosaicML(ML模型部署),并低调完成对OmniML(模型压缩)的收购。表面上的合作默契逐渐被竞争姿态取代,两家公司选择在同一天举办年度盛会,向世界展示其在生成式AI领域的雄心。Snowflake自2020年上市以来市值已达579.2亿美元(2023.8.1),而Databricks虽未上市但估值已达380亿美元。在生成式AI的加持下,Databricks能否超越Snowflake?Snowflake又将如何突破自我?作为投资Snowflake的基金Madrona合伙人Vivek和投资人Sabrina,分享了他们对两家公司在生成式AI领域竞争的独到见解。

上周,数据和人工智能领域迎来重要时刻,Databricks和Snowflake分别在旧金山和拉斯维加斯举办年度会议(Databricks的Data and AI Summit和Snowflake的Summit)。两家巨头选择在同周举办重要活动绝非偶然。过去十年里,Snowflake和Databricks既是合作伙伴也是竞争对手,但这一周明显表明,它们已成为彼此的主要竞争者,而新的战场正是人工智能。两个会议的讨论和宣布几乎都聚焦于生成式人工智能,传递出重要信息:每家公司都必须从数据战略出发,才能构建生成式人工智能战略。Databricks和Snowflake都试图证明,为何他们能在这一旅程中为客户提供最佳支持。曾经是战略合作伙伴的两家公司,为何在人工智能新时代演变为激烈竞争者?让我们深入剖析。

Snowflake与Databricks百亿美金AI之争:生成式AI战场谁主沉浮插图

【免责声明:Madrona曾投资SnowflakeC轮,并仍持有部分股份。】文章源自:Aspiring for Intelligence 硅兔编辑部翻译

01Snowflake:从数据仓库到数据云

Snowflake与Databricks百亿美金AI之争:生成式AI战场谁主沉浮插图1

Snowflake由数据库专家Benoît Dageville和Thierry Cruanes于2012年创立。他们敏锐地发现传统数据仓库存在”固化、昂贵且难以使用”的问题。Dageville和Cruanes与Vectorwise前CEO Marcin Zukowski合作,构建了基于三大核心前提的未来数据仓库:完全云架构、计算与存储分离实现无限扩展、弹性计算资源带来前所未有的查询处理速度。如今,Snowflake已从云数据仓库升级为”数据云”,为客户提供访问、构建、协作和变现数据的单一平台。十多年间,Snowflake成长为市值550亿美元的上市公司,服务6000多家客户,包括众多《财富》500强企业。Snowflake与Azure、AWS、GCP等主要云服务商合作,现正将目光转向人工智能领域。为实现这一目标,Snowflake在AI和机器学习领域展开了一系列收购和产品发布:Snowpark支持数据科学家使用首选编程语言进行端到端机器学习工作负载开发;2022年3月以8亿美元收购Streamlit,使客户能通过几行代码开发数据密集型应用;今年早些时候收购Neeva,加速企业与数据的交互和搜索,实现更具对话性的体验。

02Databricks:构建Lakehouse

Snowflake与Databricks百亿美金AI之争:生成式AI战场谁主沉浮插图2

Databricks成立于2013年,由包括现任CEO Ali Ghodsi在内的七位UC Berkeley AMPLab研究员创立。他们构思了Apache Spark这一大规模数据处理的开源统一分析引擎,现已成为主流数据处理框架。Databricks最初目标是商业化Spark,推出企业级Spark版本,满足大型组织的需求。随后发展为创新的”Lakehouse平台”,统一数据、分析和人工智能。Lakehouse概念融合了集成、存储、处理、治理、共享、分析和人工智能功能。过去十年中,Databricks成为全球估值最高的私人公司之一,2021年估值达380亿美元,近期实现10亿美元收入里程碑。他们服务成千上万的企业客户和开源用户,被视为最受瞩目的IPO之一。在持续增长中,Databricks逐渐将自己定位为人工智能领域的领导者,近期完成对MosaicML的13亿美元收购,并开源指令调优LLM Dolly,训练成本低于30美元。

03AI中的碰撞

Snowflake与Databricks百亿美金AI之争:生成式AI战场谁主沉浮插图3

Snowflake和Databricks都占据良好生态位,可利用企业为生成式AI做准备的结构性趋势。随着生成式AI应用普及,两家公司都试图将自己定位为战略性多产品数据平台。以下是各自会议的重要公告及对两家公司人工智能战略的总体看法。

Snowflake主要公告:
开发者公告:
1)原生应用框架:允许开发人员创建、分发和变现应用程序,基于Snowflake数据云扩展。
2)Snowpark容器服务:扩展数据可编程性和计算基础架构,支持编程语言、第三方软件,为全栈应用程序和LLM提供安全治理。
其他重要公告:Snowpipe流式处理功能;动态表格(材料化表格);Document AI服务;Iceberg Tables。
合作伙伴公告:
与NVIDIA合作将NeMo企业开发框架嵌入Snowflake数据云,支持客户构建和部署LLMs。
与Microsoft合作扩展Azure合作伙伴关系,整合OpenAI和Azure AI/ML服务。
与Weights & Biases合作,通过Snowflake容器服务加速ML模型迭代开发。
还宣布与Alteryx、Hex、Dataiku等公司的合作。

Snowflake与Databricks百亿美金AI之争:生成式AI战场谁主沉浮插图4

我们的看法:
直到最近,Snowflake未透露生成式AI计划,投资者对其竞争力表示担忧。2023年峰会展示Snowflake作为可信赖数据云提供商的强大愿景。与Nvidia合作及Snowpark容器服务发布,使Snowflake成为AI数据堆栈中更有竞争力的参与者。Snowflake的核心观点是,客户能在其数据云中安全访问、开发和部署LLMs,同时获得Nvidia GPU和AI软件加速计算。虽然令人印象深刻,但Snowflake在AI领域仍落后于Databricks。

Databricks主要公告:
开发者公告:
1)LakehouseIQ:基于LLM的自然语言接口,用于搜索和查询数据,理解客户数据架构和查询模式。
2)LakehouseAI:宣布Databricks ML新功能,包括LLMOps能力、向量搜索、特征服务和MLFlow Gateway。
3)MosaicML:峰会前宣布以13亿美元收购MosaicML,定位为”构建GenAI模型的机器”。
其他值得注意的公告:Delta Lake 3.0、MLFlow 2.5支持不同后端LLMs、Lakehouse Apps和智能监控。

Snowflake与Databricks百亿美金AI之争:生成式AI战场谁主沉浮插图5

我们的观点:
Databricks通过Lakehouse平台整合数据、AI模型、监控和治理能力,采取统一AI方法。客户能更高效开发GenAI解决方案,认为Databricks在机器学习开发方面更快速、经济、易用。通过对Dolly和MosaicML的投资,Databricks巩固了在GenAI领域的领导地位。Databricks强调Lakehouse是GenAI初创企业训练和部署模型的最佳方式,以成本效益方式利用专有数据。

04展望未来

Snowflake与Databricks百亿美金AI之争:生成式AI战场谁主沉浮插图6

尽管生成式AI热潮已持续8个多月,但过去一周表明Snowflake和Databricks正在展开激烈竞争。我们可以期待:
1.收购将继续进行→ Snowflake拥有约40亿美元现金,Databricks估值高且拥有交易资金,而AI和数据工具初创企业渴望在低迷的IPO市场找到出口。Neeva和MosaicML不会是最后一次收购,市场将出现整合。
2.客户将受益→ 在竞争升级中,客户将是最大赢家。两家巨头快速为平台添加新产品和服务,构建”一站式商店”,让数据科学家、工程师和AI从业者更高效合作,民主化AI访问。
3.Azure和AWS将赚取更多利润→ Snowflake和Databricks的AI扩张将增加对Azure和AWS计算需求,这些超大规模云服务提供商将受益。

无论谁在AI竞争中获胜,Snowflake和Databricks都处于良好位置,可利用这一代数据革命。尽管来自价值链不同部分,关系在过去十年中发生变化,但它们现在正处于一场奖励巨大的竞赛中。本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年08月05日

10:08
微新创想8月5日讯 谷歌近日发布了一则引人注目的广告片,以幽默的方式嘲讽了苹果AI功能的跳票现象,并巧妙地引导苹果用户转向Pixel 10系列智能手机。在这则广告中,谷歌用简洁有力的语言指出,如果你曾因为某个"即将推出"的功能而考虑购买新手机,那么当这一期待已经持续整整一年时,或许该重新审视这个"即将推出"的定义,或者干脆选择另一款手机。 此前在2024年苹...
10:08
微新创想8月5日讯 苹果公司于今年5月正式宣布推出革命性的辅助功能更新,其中脑机接口(BCI)技术成为焦点。这项创新举措将显著提升行动不便用户的设备使用体验,iOS、iPadOS和visionOS系统将全面支持脑机接口切换控制协议。苹果强调,该技术突破的核心优势在于无需任何物理操作即可实现设备控制,这意味着iPhone、iPad乃至Apple Vision ...
10:08
微新创想8月5日重磅消息,据行业深度报道,苹果公司近期公布了一项具有里程碑意义的两年生产计划,核心目标是将更先进的OLED显示技术全面应用于iPhone系列产品。根据爆料信息,搭载双层OLED屏幕的iPhone有望在2028年之后正式问世,这一技术升级将显著提升苹果手机的用户体验。 目前,苹果在平板电脑领域已经率先采用了名为"Tandem OLED"的双层O...
10:08
微新创想8月5日最新消息,一位科技博主意外曝光了iPhone 17 Air与iPhone 17 Pro的电池配置对比图,引发广泛关注。据爆料内容显示,iPhone 17 Air的电池厚度惊人地薄至2.49mm,仅为iPhone 17 Pro的一半左右,其电池容量也仅为2800mAh(而iPhone 17 Pro的电池容量目前尚不明确)。 值得注意的是,作为一...
10:08
微新创想8月5日讯 腾讯旗下热门游戏《金铲铲之战》鸿蒙版今日正式登陆华为应用市场尝鲜专区,为鸿蒙生态再添新成员。今日12:00起,该游戏将开启万人删档测试,测试周期定于2025年8月5日至9月3日,为玩家提供全新的游戏体验。 据悉,《金铲铲之战体验服》鸿蒙版测试名额实行限时开放机制,一旦达到注册上限将暂停接受新用户加入。作为删档测试服务器,该版本将不定期进行...
10:08
微新创想8月5日重磅报道,小米全新推出的YU7车型一经上市便引发市场热潮,其搭载的定制化4K云台摄像头更是成为车主们争相抢购的热门配置。这款摄像头不仅拥有800万像素高清传感器,更配备双轴云台转向系统,实现了车内外的全方位监控,甚至支持手势识别智能控车,为用户带来前所未有的交互体验和娱乐性。 然而部分用户在使用过程中反映,摄像头外壳在运行时温度较高,引发了关...
10:08
小米汽车最新一期"答网友问"深度解析YU7零重力座椅黑科技 8月5日,小米汽车官方发布最新一期互动问答,就备受关注的YU7前排零重力座椅功能作出详细解读。据悉,这款旗舰车型全系车型均支持主驾、副驾零重力座椅的付费选装,为用户带来前所未有的极致驾乘体验。 零重力座椅的核心优势在于通过科学调节实现人体重心均衡分布,带来类似漂浮的零重力状态,同时配备先进的...
09:30
近日,阿里巴巴通义实验室携手南开大学计算机科学学院共同推出了一项突破性的视频大模型压缩技术——LLaVA-Scissor。这一创新成果旨在有效应对视频模型处理过程中所面临的核心挑战,特别是传统方法在处理视频帧时因高 token 数量而导致的推理速度缓慢和扩展性不足等问题。视频模型需要对每一帧进行独立编码,这种序列化处理方式使得 token 数量急剧增长,给计...
09:30
近日 Cloudflare 发布了一份令人关注的报告揭露了人工智能搜索初创公司 Perplexity 在网络爬虫访问限制方面存在违规行为。根据 Cloudflare 揭示的信息 Perplexity 爬虫在遭遇网站设置的限制时会采取隐蔽身份的方式试图绕过这些障碍这些限制包括 robots.txt 文件中声明的规则以及 Web 应用程序防火墙(WAF)的设置。...
09:30
智谱公司隆重推出基于前沿大模型的开发效率革命性工具——Zread.ai,旨在以AI技术为开发者扫除在接手旧项目、撰写文档及理解开源项目过程中遭遇的常见难题。Zread.ai通过其核心功能,包括一键代码解析、智能知识生成和高效团队协作,为开发者带来前所未有的效率提升体验。 Zread.ai的核心价值主要体现在三大方面:深度解析开源项目、快速掌握历史代码库以...
09:30
OpenAI正为其旗舰产品ChatGPT推出一系列创新功能,旨在全面提升其作为实用工具的价值,而非单纯追求用户参与度或点击量。该公司明确表示,真正的成功标准在于用户是否愿意反复使用并从中获得实际收益。通过强化工具的实用性,OpenAI坚信用户将更愿意为其付费使用。 ### 增强用户时间管理和心理健康支持 为了帮助用户更科学地管理使用时间,OpenAI计划在长...
09:30
近日,Google 安全副总裁 Heather Adkins 在一场重要活动中正式宣布,其尖端人工智能驱动的漏洞研究员 Big Sleep 已成功在多款广受欢迎的开源软件中识别并报告了20个关键安全漏洞。这些漏洞主要集中在音频和视频处理的核心库 FFmpeg 以及图像处理软件 ImageMagick 等关键项目中,对软件生态安全构成潜在威胁。 Big Sle...