Databricks 宣布达成一项重大战略交易,将以约 13 亿美元的估值收购生成式人工智能领域的领先初创公司 MosaicML。这一举措标志着 Databricks 在企业级 AI 解决方案领域的重大布局,旨在满足市场对构建类似 ChatGPT 的智能应用日益增长的需求。

Databricks 是一家总部位于旧金山的创新企业,专注于数据存储和管理技术,此次收购将使其先进的数据管理能力与 MosaicML 的语言模型平台实现完美融合。通过这一整合,企业将能够利用自身专有数据,以更低的成本自主构建高效的语言模型,摆脱对公开网络数据的依赖。目前,许多企业仍需借助第三方训练的语言模型,这往往涉及数据安全和隐私的顾虑。

MosaicML 是一家成立于 2021 年的旧金山初创公司,致力于将生成式人工智能的构建成本从数千万美元降至每个模型数十万美元。公司拥有 62 名员工,已成功筹集 6400 万美元资金。此次收购完成后,MosaicML 将作为 Databricks 的独立服务继续运营,进一步强化其在 AI 领域的竞争力。

生成式人工智能技术能够根据用户自然语言提示,生成原创文本、图像和计算机代码,应用前景广阔。自 OpenAI 于去年 11 月推出 ChatGPT 以来,企业对生成式 AI 的兴趣呈现爆发式增长。Anthropic、OpenAI 等公司通过授权现成语言模型,帮助企业构建定制化 AI 应用。然而,这些现成模型因训练数据涉及互联网噪音,可能影响结果准确性,且数据隐私问题引发企业担忧。

Databricks 首席执行官 Ali Ghodsi 强调:“从零构建模型时,你清楚需要什么内容。”他认为,现成模型因训练数据混杂无关信息,可能产生误导性结果。同时,企业对数据隐私和安全的顾虑也促使它们寻求更可控的 AI 解决方案。

机器学习专家和 AI 供应商指出,大型语言模型如 ChatGPT 在计算和综合能力上优势明显,但特定领域的模型虽规模较小,却具备强大的专业功能。毕马威美国人工智能负责人 Sreekar Krishna 认为,数据管理和模型选择仍是企业面临的核心挑战。“数据始终是成功的关键,”他强调,随着大型语言模型的普及,对高质量数据的需求将持续攀升。企业技术领导者正承受着数据准备的压力,因为数据是算法学习和预测的基础。

Replit 等公司已开始利用 Databricks 的数据管道,并将数据传输至 MosaicML 训练代码生成模型,展现了这一技术生态的潜力。Databricks 的 Lakehouse 技术通过统一数据、分析和 AI 编程工具,为企业构建 AI 应用提供强大支持。公司通过出租分析、AI 及云软件服务,为企业技术系统提供“镐和铲子”,助力 AI 应用落地。

Databricks 成立于十年前,由加州伯克利数据科学家团队创立。2021 年 8 月完成 16 亿美元融资后,其私募市场估值飙升至 380 亿美元。主要投资者包括摩根士丹利的 Counterpoint Global、安德烈森·霍洛维茨、贝莱·吉福德等。去年,公司年收入突破 10 亿美元。

PitchBook 数据显示,全球生成式 AI 市场支出预计今年年底达 426 亿美元,至 2026 年将增长至 981 亿美元,年复合增长率高达 32%。2023 年前 5 个月,生成式 AI 初创企业风险投资额已达 127 亿美元,较 2022 年的 48 亿美元大幅增长。

生物制药服务公司 Syneos HeAlth 的首席信息和数字官 Larry Pickett 表示,当前医疗数据训练模型的成本高达 100 万至 200 万美元。分析人士认为,特定领域的模型比通用模型更具价值,因为它们蕴含更多行业术语和专业知识。Pickett 期待通过使用小型预训练模型,大幅降低构建成本。“并非每个应用都需要 GPT-4,”Krishna 指出,大型语言模型正朝着精细化方向发展,未来将出现更小巧、可嵌入移动设备的模型,满足特定场景需求。

最新快讯

2025年12月21日

12:52
截至12月21日11时,全国多省因恶劣天气实施交通管制,安徽、湖北、河南、甘肃、新疆、黑龙江、青海7省(区)国省干线共有25个路段采取封闭管控措施。其中,4个路段完全封闭主线,21个路段关闭收费站,确保行车安全。交通运输部路网中心特别提醒,相关地区已启动应急预案,通过主动管控手段降低安全风险。由于天气状况复杂多变,具体路段的恢复通行时间将根据实时气象数据另行...
12:52
2025年12月18日,独立游戏界迎来重大震动。知名独立游戏大奖Six One Indie主办方突然宣布,撤销《光与影:33号远征队》及其开发商Sandfall Interactive所获得的年度最佳游戏与最佳出道作两项大奖。这一决定引发广泛关注,其背后原因直指生成式人工智能技术的使用违规。 据悉,该游戏在参评阶段曾向评委郑重承诺,开发过程中未使用任何人...
12:21
2025年12月12日,知名游戏制作人小岛秀夫在一场备受瞩目的采访中,首次深入分享了其全新力作《死亡搁浅 2:冥滩之上》的创作理念与心路历程。这位享誉全球的游戏设计大师透露,本作刻意在剧情中注入违和感与摩擦感,旨在营造一种独特的沉浸式体验,让玩家在游戏结束后仍能久久回味,如同品尝一道难以消化的美食,需要反复咀嚼才能体会其深层韵味。这种独特的叙事手法,正是小岛...
12:21
2025年12月20日傍晚,美国加利福尼亚州旧金山市遭遇了一场突如其来的大规模停电事故,整个城市陷入一片黑暗。据太平洋天然气和电力公司最新通报,此次停电事件波及范围空前,直接影响约13万家庭和商户,这一数字占该公司在旧金山服务客户总数的近三分之一。作为美国西海岸重要的金融科技中心,此次停电对旧金山的商业活动和居民生活造成了显著影响。 太平洋天然气和电力公司紧...
12:21
2024年,重庆市的宠物市场迎来蓬勃发展,犬、猫饲养总量成功突破200万只大关,展现出强大的市场活力。据最新数据显示,整个宠物市场规模正以年均18%的惊人增速扩张,整体规模已超过200亿元,成为城市消费新热点。这一繁荣景象的背后,是完善的产业链体系逐渐成型,涵盖了从宠物繁育、食品加工到智能用品研发、连锁医疗及新零售服务的全链条布局,为宠物爱好者提供了全方位的...
12:21
2025年,中国海上油气勘探开发领域再传捷报,渤海油田年累计生产油气当量成功突破4000万吨大关,这一里程碑不仅刷新了该油田的历史生产记录,更彰显了中国能源工业的卓越成就。作为中国最大的海上油田,渤海油田的此次突破性进展,充分展现了中国海油在深海油气资源勘探开发领域的强大实力和技术创新能力。 渤海油田作为中国重要的海上能源基地,其主产区位于广阔的渤海海域。近...
12:21
12月21日起,我国中东部地区将迎来明显的降水过程,雨雪天气逐渐增多。预计在接下来的两天内,新一轮雨雪天气将正式发展,其中东北地区部分区域将面临较强的降雪,公众需密切关注天气变化,做好防范措施。 与此同时,两股冷空气接连影响我国,导致气温呈现起伏波动。各地居民需根据实时天气情况,适时调整着装,注意保暖防寒。建议外出时携带雨具和防风外套,以应对多变天气。 ...
12:21
"十四五"规划实施以来,我国智慧农业建设进入高速发展期,创新能力实现跨越式提升。国家层面精心布局,在全国范围内建设了34个智慧农业创新中心及其分中心,同时设立30个农业农村部农业信息技术重点实验室,为关键技术研发与成果转化提供坚实支撑。这些举措有力推动了农业科技创新体系的完善,为现代农业发展注入强劲动力。 在技术应用方面,物联网、大数据、人工智能等前沿技术已...
12:21
12月20日,历史性时刻在中国重庆上演。国内首块L3级自动驾驶专用号牌“渝AD0001Z”正式发放,这一标志性事件由重庆市公安局交通管理总队面向长安汽车完成授予,正式宣告我国首款L3级自动驾驶车型迈入合规化运营阶段。作为行业破冰者,长安汽车借此成为全国首家获得L3级自动驾驶官方号牌的企业,不仅率先解锁了智能驾驶新纪元,更在技术商业化道路上树立了重要里程碑。 ...
12:21
2025年12月16日,迪庆藏族自治州香格里拉机场传来喜讯,其货邮吞吐量成功突破1600吨大关,这一亮眼成绩不仅完成了年度预定目标的119.4%,更刷新了该机场自通航以来的历史纪录。这一显著进步的背后,是香格里拉机场在破解高原货源短缺这一长期瓶颈上所做的持续努力,以及不断优化的货运保障体系的显著成效。 香格里拉机场地处高原,地理环境的特殊性曾给货源组织带来诸...
12:21
12月20日,在备受瞩目的「Alpha峰会」上,金山办公助理总裁朱熠锷发表了关于企业AI应用发展趋势的重要观点。他明确指出,当前企业AI应用正经历一场深刻的范式转变——从传统的“以模型为中心”模式,加速迈向“以数据为中心”的新阶段。这一转变的核心逻辑在于,数据质量已不再仅仅是AI应用的辅助要素,而是直接决定了AI应用能否产生实际价值的决定性因素。 朱熠锷强调...
12:21
12月20日,备受瞩目的国家人工智能应用中试基地(医疗)·浙江正式拉开年度成果发布序幕,标志着基地产业园正式投入运营,同时其服务平台也同步面向社会公众开放。这一重要里程碑不仅彰显了基地在推动医疗AI领域发展的坚定决心,更彰显了其作为区域创新引擎的强大实力。 作为国家‘人工智能+’行动计划和‘两重’战略的核心组成部分,该基地落户浙江,承载着打造‘国际一流’‘人...