Databricks 宣布达成一项重大战略交易,将以约 13 亿美元的估值收购生成式人工智能领域的领先初创公司 MosaicML。这一举措标志着 Databricks 在企业级 AI 解决方案领域的重大布局,旨在满足市场对构建类似 ChatGPT 的智能应用日益增长的需求。

Databricks 是一家总部位于旧金山的创新企业,专注于数据存储和管理技术,此次收购将使其先进的数据管理能力与 MosaicML 的语言模型平台实现完美融合。通过这一整合,企业将能够利用自身专有数据,以更低的成本自主构建高效的语言模型,摆脱对公开网络数据的依赖。目前,许多企业仍需借助第三方训练的语言模型,这往往涉及数据安全和隐私的顾虑。

MosaicML 是一家成立于 2021 年的旧金山初创公司,致力于将生成式人工智能的构建成本从数千万美元降至每个模型数十万美元。公司拥有 62 名员工,已成功筹集 6400 万美元资金。此次收购完成后,MosaicML 将作为 Databricks 的独立服务继续运营,进一步强化其在 AI 领域的竞争力。

生成式人工智能技术能够根据用户自然语言提示,生成原创文本、图像和计算机代码,应用前景广阔。自 OpenAI 于去年 11 月推出 ChatGPT 以来,企业对生成式 AI 的兴趣呈现爆发式增长。Anthropic、OpenAI 等公司通过授权现成语言模型,帮助企业构建定制化 AI 应用。然而,这些现成模型因训练数据涉及互联网噪音,可能影响结果准确性,且数据隐私问题引发企业担忧。

Databricks 首席执行官 Ali Ghodsi 强调:“从零构建模型时,你清楚需要什么内容。”他认为,现成模型因训练数据混杂无关信息,可能产生误导性结果。同时,企业对数据隐私和安全的顾虑也促使它们寻求更可控的 AI 解决方案。

机器学习专家和 AI 供应商指出,大型语言模型如 ChatGPT 在计算和综合能力上优势明显,但特定领域的模型虽规模较小,却具备强大的专业功能。毕马威美国人工智能负责人 Sreekar Krishna 认为,数据管理和模型选择仍是企业面临的核心挑战。“数据始终是成功的关键,”他强调,随着大型语言模型的普及,对高质量数据的需求将持续攀升。企业技术领导者正承受着数据准备的压力,因为数据是算法学习和预测的基础。

Replit 等公司已开始利用 Databricks 的数据管道,并将数据传输至 MosaicML 训练代码生成模型,展现了这一技术生态的潜力。Databricks 的 Lakehouse 技术通过统一数据、分析和 AI 编程工具,为企业构建 AI 应用提供强大支持。公司通过出租分析、AI 及云软件服务,为企业技术系统提供“镐和铲子”,助力 AI 应用落地。

Databricks 成立于十年前,由加州伯克利数据科学家团队创立。2021 年 8 月完成 16 亿美元融资后,其私募市场估值飙升至 380 亿美元。主要投资者包括摩根士丹利的 Counterpoint Global、安德烈森·霍洛维茨、贝莱·吉福德等。去年,公司年收入突破 10 亿美元。

PitchBook 数据显示,全球生成式 AI 市场支出预计今年年底达 426 亿美元,至 2026 年将增长至 981 亿美元,年复合增长率高达 32%。2023 年前 5 个月,生成式 AI 初创企业风险投资额已达 127 亿美元,较 2022 年的 48 亿美元大幅增长。

生物制药服务公司 Syneos HeAlth 的首席信息和数字官 Larry Pickett 表示,当前医疗数据训练模型的成本高达 100 万至 200 万美元。分析人士认为,特定领域的模型比通用模型更具价值,因为它们蕴含更多行业术语和专业知识。Pickett 期待通过使用小型预训练模型,大幅降低构建成本。“并非每个应用都需要 GPT-4,”Krishna 指出,大型语言模型正朝着精细化方向发展,未来将出现更小巧、可嵌入移动设备的模型,满足特定场景需求。

最新快讯

2025年12月13日

12:52
2025年12月13日,摩尔线程正式发布一则重要公告,宣布将利用不超过75亿元人民币的闲置募集资金进行现金管理。公司相关负责人特别强调,这一75亿元是授权额度上限,并非实际投资规模,实际动用金额预计将显著低于该上限。随着公司募投项目的稳步推进以及自有资金的合理调配,闲置募集资金将逐步减少,相应的现金管理额度也将进行动态调整。此次决策的核心目标在于最大化资金使...
12:52
2025年12月13日,重庆市卫生健康委员会发布官方通报,披露重庆医科大学附属儿童医院在治疗脊髓性肌萎缩症患儿过程中,存在严重的药品存储违规行为。据悉,一名患有脊髓性肌萎缩症的儿童在接受诺西那生钠注射治疗时,该药物因医生误操作被存放在冷冻层而非规定的2℃-8℃冷藏环境中。幸运的是,尽管药物存储条件不符合规范,患儿注射后并未出现任何不良反应。然而,这一事件已严...
12:52
尼康近日正式宣布,将全力加速新一代半导体工艺设备Litho Booster 1000对准站的研发进程,并确定其将于2026年下半年正式推向市场。这款尖端设备的核心功能在于光刻曝光前对晶圆进行高精度测量,通过实时获取补偿数据并直接反馈至光刻机系统,能够显著提升多层结构的套刻精度,为半导体制造工艺带来革命性突破。 相较于上一代产品,Litho Booster 1...
12:52
2025年12月13日,备受瞩目的全国医疗保障工作会议正式落下帷幕,会议就未来医保基金结算机制改革达成重要共识。据悉,2026年起我国将全面启动医保基金即时结算工作,并创新性地探索季度清算机制,旨在通过制度创新大幅提升医保基金使用效率。根据会议明确部署,到2026年,即时结算资金占比和定点医疗机构开通率这两项关键指标均需突破80%大关,标志着我国医保结算体系...
12:52
12月13日,国家医疗保障局在2025年全国医疗保障工作会议上公布了一组令人瞩目的数据,揭示了“十四五”期间医保基金监管的显著成效。据通报,全国各级医保部门通过不懈努力,累计追回医保资金高达1200亿元,彰显了医保基金监管的坚定决心和强大力度。 在打击欺诈骗保方面,医保部门重拳出击,通过协议处理、行政处罚等多种手段,成功查处了太和县、无锡虹桥医院以及哈尔滨4...
12:21
2025年12月13日,AMD重磅发布了两款搭载前沿AI技术的专业显卡——Radeon AI PRO R9700S与R9600D,正式进军高端AI工作站市场。这一战略举措标志着AMD在专业图形领域迈出重要一步,旨在为科研、设计及数据分析等领域的专业人士提供更强大的计算支持。 紧随其后,蓝宝石、撼讯、华擎等知名AIB合作伙伴迅速响应,纷纷推出基于AMD新显卡的...
12:21
2025年12月12日,科技界传来重磅消息,谷歌凭借其先进的Nano Banana图像生成技术,正式推出创新AI试衣功能。这项突破性服务允许用户只需上传一张个人自拍,系统便能迅速生成逼真的全身数字模特,让用户直观预览各类服装的上身效果。这一功能的核心目标在于有效解决网购时普遍存在的"买家秀与卖家秀"差异问题,为消费者提供更精准的购物体验。 目前该功能已在美国...
11:51
2025年12月12日,不少Windows 11用户遭遇新版Outlook应用无法启动的困扰,点击图标后系统陷入无响应状态。这一技术故障已持续约一周时间,给依赖邮件服务的用户带来诸多不便。值得注意的是,受影响的主要是新版Outlook,而网页版和移动端应用均能正常运行,未受此次问题波及。 经过技术团队深入排查,发现Olk和OneAuth这两个关键缓存文件夹数...
11:51
2025年12月10日,网络安全领域再曝重大威胁。Bitdefender安全研究团队发布紧急报告,揭露黑客利用莱昂纳多·迪卡普里奥主演的科幻大片《一战再战》盗版资源实施的新型钓鱼攻击。攻击者将PowerShell恶意脚本巧妙嵌入电影字幕文件,通过伪装成电影启动器的快捷方式(CD.lnk)进行诱导,一旦用户点击该链接,便会触发脚本自动提取并执行隐藏在字幕文件中...
11:51
2025年12月13日9时8分,中国航天事业再传捷报,快舟十一号遥八运载火箭在酒泉卫星发射中心点火升空,以精准高效的姿态将迪迩五号空间试验器与希望五号二期卫星顺利送入预定轨道。此次发射任务的成功,不仅标志着快舟十一号火箭第4次飞行任务的圆满收官,更彰显了我国航天技术的持续进步与创新实力。 作为我国自主研制的高性能固体燃料运载火箭,快舟十一号凭借其快速响应、灵...
11:51
2025年12月13日,备受瞩目的广州人工智能与机器人产业大会隆重召开。会上,广东省正式发布具有里程碑意义的具身智能训练场“1+1+N”体系,为全国该领域发展描绘了全新蓝图。这一创新体系的核心在于构建一个多层次、广覆盖的训练与示范网络,其中“1”代表深圳示范窗口的建设,将重点打造全国首个具身智能机器人友好示范城区。该示范区将突破传统封闭式训练模式,将机器人的...
11:51
2025年3月13日,GDPS 2025全球开发者先锋大会隆重开幕。在开幕式上,中国科学院院士姚期智发表了题为《具身智能的未来突破方向》的重要演讲,系统阐述了具身智能技术实现跨越式发展的四大关键路径。他指出,当前具身智能领域虽取得显著进展,但仍面临诸多挑战,唯有突破以下四大核心技术瓶颈,才能真正释放其巨大潜力。 首先,姚期智强调具身智能必须实现从模仿学习到推...