Databricks 宣布达成一项重大战略交易,将以约 13 亿美元的估值收购生成式人工智能领域的领先初创公司 MosaicML。这一举措标志着 Databricks 在企业级 AI 解决方案领域的重大布局,旨在满足市场对构建类似 ChatGPT 的智能应用日益增长的需求。

Databricks 是一家总部位于旧金山的创新企业,专注于数据存储和管理技术,此次收购将使其先进的数据管理能力与 MosaicML 的语言模型平台实现完美融合。通过这一整合,企业将能够利用自身专有数据,以更低的成本自主构建高效的语言模型,摆脱对公开网络数据的依赖。目前,许多企业仍需借助第三方训练的语言模型,这往往涉及数据安全和隐私的顾虑。

MosaicML 是一家成立于 2021 年的旧金山初创公司,致力于将生成式人工智能的构建成本从数千万美元降至每个模型数十万美元。公司拥有 62 名员工,已成功筹集 6400 万美元资金。此次收购完成后,MosaicML 将作为 Databricks 的独立服务继续运营,进一步强化其在 AI 领域的竞争力。

生成式人工智能技术能够根据用户自然语言提示,生成原创文本、图像和计算机代码,应用前景广阔。自 OpenAI 于去年 11 月推出 ChatGPT 以来,企业对生成式 AI 的兴趣呈现爆发式增长。Anthropic、OpenAI 等公司通过授权现成语言模型,帮助企业构建定制化 AI 应用。然而,这些现成模型因训练数据涉及互联网噪音,可能影响结果准确性,且数据隐私问题引发企业担忧。

Databricks 首席执行官 Ali Ghodsi 强调:“从零构建模型时,你清楚需要什么内容。”他认为,现成模型因训练数据混杂无关信息,可能产生误导性结果。同时,企业对数据隐私和安全的顾虑也促使它们寻求更可控的 AI 解决方案。

机器学习专家和 AI 供应商指出,大型语言模型如 ChatGPT 在计算和综合能力上优势明显,但特定领域的模型虽规模较小,却具备强大的专业功能。毕马威美国人工智能负责人 Sreekar Krishna 认为,数据管理和模型选择仍是企业面临的核心挑战。“数据始终是成功的关键,”他强调,随着大型语言模型的普及,对高质量数据的需求将持续攀升。企业技术领导者正承受着数据准备的压力,因为数据是算法学习和预测的基础。

Replit 等公司已开始利用 Databricks 的数据管道,并将数据传输至 MosaicML 训练代码生成模型,展现了这一技术生态的潜力。Databricks 的 Lakehouse 技术通过统一数据、分析和 AI 编程工具,为企业构建 AI 应用提供强大支持。公司通过出租分析、AI 及云软件服务,为企业技术系统提供“镐和铲子”,助力 AI 应用落地。

Databricks 成立于十年前,由加州伯克利数据科学家团队创立。2021 年 8 月完成 16 亿美元融资后,其私募市场估值飙升至 380 亿美元。主要投资者包括摩根士丹利的 Counterpoint Global、安德烈森·霍洛维茨、贝莱·吉福德等。去年,公司年收入突破 10 亿美元。

PitchBook 数据显示,全球生成式 AI 市场支出预计今年年底达 426 亿美元,至 2026 年将增长至 981 亿美元,年复合增长率高达 32%。2023 年前 5 个月,生成式 AI 初创企业风险投资额已达 127 亿美元,较 2022 年的 48 亿美元大幅增长。

生物制药服务公司 Syneos HeAlth 的首席信息和数字官 Larry Pickett 表示,当前医疗数据训练模型的成本高达 100 万至 200 万美元。分析人士认为,特定领域的模型比通用模型更具价值,因为它们蕴含更多行业术语和专业知识。Pickett 期待通过使用小型预训练模型,大幅降低构建成本。“并非每个应用都需要 GPT-4,”Krishna 指出,大型语言模型正朝着精细化方向发展,未来将出现更小巧、可嵌入移动设备的模型,满足特定场景需求。

最新快讯

2026年01月20日

08:14
2026年1月19日,开源社区迎来重大突破。开发者Phialsbasement通过精准的代码修补,成功攻克了Wine兼容层在Linux系统中的技术壁垒,彻底解决了Adobe Creative Cloud在Linux平台上的安装难题。这一突破性进展标志着Linux用户在享受专业设计软件方面迈出了历史性一步。 此前,由于XML解析和JavaScript执行机制与...
08:14
2026年2月6日,NASA将正式启动备受瞩目的“阿耳忒弥斯2号”绕月任务,这一历史性时刻将见证4名宇航员搭乘“猎户座”飞船,开启人类深空飞行的全新篇章。作为人类自50多年前阿波罗计划以来首次载人绕月飞行,此次任务承载着探索深空、验证关键技术的重大使命。尽管原定于2月4日的发射计划因技术原因推迟至美东时间2月6日21时41分(北京时间7日10时41分),但这...
08:14
2026年1月20日,英国伦敦大学学院的一支科研团队在炎症研究领域取得重大突破,揭示了调控炎症反应的关键分子机制。该研究发现,环氧氧脂质(Epoxyeicosatrienoic acids, EETs)作为一种天然存在于人体免疫系统的物质,能够充当"制动器"的角色,有效抑制中间单核细胞(intermediate monocytes)的过度增殖。这种抑制作用对...
08:14
1月20日,中央气象台紧急发布寒潮、冰冻及大风三重预警,预示着一场严峻的天气考验即将来临。受强冷空气的猛烈冲击,我国江淮西部、江南、华南以及西南地区东南部等广大区域将迎来剧烈降温,部分地区降温幅度惊人,可达8℃,局部地区甚至可能超过10℃。这场降温潮的威力不容小觑,预计21日早晨,标志性的0℃等温线将大幅南压,直抵贵州南部至江西南部一带。这意味着南方多地将陷...
08:14
2026年1月20日,美国斯坦福大学研究团队在固态锂金属电池领域取得重大突破,成功解决了困扰行业多年的固态电解质抗裂难题。这一创新成果通过在电解质表面引入一层经过特殊退火处理的超薄银涂层,显著增强了材料在承受机械压力和快速充电过程中的稳定性,有效避免了电解质开裂现象的发生。该研究成果以封面文章形式发表于国际顶级学术期刊《自然·材料》,为推动固态电池技术的商业...
08:14
2026年1月20日,人民日报重磅发表评论文章,对中国经济展现出的强大韧性与增长潜力给予高度肯定。文章指出,过去五年间,尽管国际环境复杂多变,中国始终以稳健的姿态成为全球经济增长的核心引擎,为世界经济复苏注入关键动力 这份权威评论深入剖析了中国经济持续领跑全球的深层原因。文章强调,创新力与执行力是驱动中国经济增长的双引擎。在创新层面,中国创新指数已跻身全球前...
08:14
Bungie正式官宣,《失落星船:马拉松》将于2026年3月5日震撼登陆全球玩家视野,覆盖PC、PS5及Xbox Series X|S三大主流平台。这款备受期待的作品将推出三种发售版本以满足不同玩家的需求:标准版售价168元,豪华版248元,以及极具收藏价值的典藏版,后者定价229.99美元,折合人民币约1605元,且为Bungie商店独家发售。 预购《...
08:14
2026年1月20日,美国哥伦比亚大学的研究团队成功研发出一项突破性的人形机器人面部控制框架,该技术能够根据音频信号生成高度逼真且与语音完美同步的唇部动作。这一创新成果基于先进的深度学习算法,不仅能够精准匹配英语、法语、汉语和阿拉伯语等多种语言的发音口型,更展现出卓越的泛化能力,即便面对训练数据中未包含的语言,也能实现令人满意的唇部动作模拟。 该研究成果已正...
08:14
2026年1月20日,备受瞩目的U23男足亚洲杯半决赛对阵正式揭晓。当晚23时30分,中国U23男足将与越南U23男足在乌兹别克斯坦展开激烈角逐。这场关键战役的胜者将昂首挺进决赛,争夺亚洲顶尖青年足球的冠军荣誉。 此次半决赛对决引发广泛关注,中国队在小组赛中表现不俗,如今渴望在淘汰赛中实现突破,向更高目标发起冲击。而越南队则展现出强劲实力,连续第二届闯入...
07:42
2026年1月19日,全球Windows 11用户在安装KB5074109安全更新后遭遇了令人困扰的兼容性问题。许多用户反馈,密码管理器Keepass及KeepassXC的“自动输入”功能在特定系统对话框中失效,无法正常工作。这一故障主要出现在远程桌面连接、访问网络共享等需要模拟按键操作的场景,系统似乎在安全机制干预下主动拦截了来自这些应用的输入指令。 Ke...
07:42
2026年1月19日,微软资深工程师Raymond Chen在博客中深情回溯了Windows 95时代的经典技巧——通过按住Shift键触发快速重启。这一被遗忘的隐藏功能能够绕过完整的硬件初始化流程,直接进入保护模式下的Windows系统,从而实现惊人的重启速度。其核心机制在于调用ExitWindows函数,由win.com进程负责重新加载受保护模式的系统内...
07:42
2026年1月19日,微软正式向全球用户发出邀请,参与Copilot全新对话模式——Real Talk的测试,并开放了其革命性的视频生成功能。这一重要举措,旨在积极应对来自Google Gemini和ChatGPT等强劲对手的市场竞争压力,进一步巩固微软在人工智能领域的领先地位。 Real Talk模式通过引入“深度”与“写作风格”两大核心维度,显著提升了A...