Databricks 宣布达成一项重大战略交易,将以约 13 亿美元的估值收购生成式人工智能领域的领先初创公司 MosaicML。这一举措标志着 Databricks 在企业级 AI 解决方案领域的重大布局,旨在满足市场对构建类似 ChatGPT 的智能应用日益增长的需求。

Databricks 是一家总部位于旧金山的创新企业,专注于数据存储和管理技术,此次收购将使其先进的数据管理能力与 MosaicML 的语言模型平台实现完美融合。通过这一整合,企业将能够利用自身专有数据,以更低的成本自主构建高效的语言模型,摆脱对公开网络数据的依赖。目前,许多企业仍需借助第三方训练的语言模型,这往往涉及数据安全和隐私的顾虑。

MosaicML 是一家成立于 2021 年的旧金山初创公司,致力于将生成式人工智能的构建成本从数千万美元降至每个模型数十万美元。公司拥有 62 名员工,已成功筹集 6400 万美元资金。此次收购完成后,MosaicML 将作为 Databricks 的独立服务继续运营,进一步强化其在 AI 领域的竞争力。

生成式人工智能技术能够根据用户自然语言提示,生成原创文本、图像和计算机代码,应用前景广阔。自 OpenAI 于去年 11 月推出 ChatGPT 以来,企业对生成式 AI 的兴趣呈现爆发式增长。Anthropic、OpenAI 等公司通过授权现成语言模型,帮助企业构建定制化 AI 应用。然而,这些现成模型因训练数据涉及互联网噪音,可能影响结果准确性,且数据隐私问题引发企业担忧。

Databricks 首席执行官 Ali Ghodsi 强调:“从零构建模型时,你清楚需要什么内容。”他认为,现成模型因训练数据混杂无关信息,可能产生误导性结果。同时,企业对数据隐私和安全的顾虑也促使它们寻求更可控的 AI 解决方案。

机器学习专家和 AI 供应商指出,大型语言模型如 ChatGPT 在计算和综合能力上优势明显,但特定领域的模型虽规模较小,却具备强大的专业功能。毕马威美国人工智能负责人 Sreekar Krishna 认为,数据管理和模型选择仍是企业面临的核心挑战。“数据始终是成功的关键,”他强调,随着大型语言模型的普及,对高质量数据的需求将持续攀升。企业技术领导者正承受着数据准备的压力,因为数据是算法学习和预测的基础。

Replit 等公司已开始利用 Databricks 的数据管道,并将数据传输至 MosaicML 训练代码生成模型,展现了这一技术生态的潜力。Databricks 的 Lakehouse 技术通过统一数据、分析和 AI 编程工具,为企业构建 AI 应用提供强大支持。公司通过出租分析、AI 及云软件服务,为企业技术系统提供“镐和铲子”,助力 AI 应用落地。

Databricks 成立于十年前,由加州伯克利数据科学家团队创立。2021 年 8 月完成 16 亿美元融资后,其私募市场估值飙升至 380 亿美元。主要投资者包括摩根士丹利的 Counterpoint Global、安德烈森·霍洛维茨、贝莱·吉福德等。去年,公司年收入突破 10 亿美元。

PitchBook 数据显示,全球生成式 AI 市场支出预计今年年底达 426 亿美元,至 2026 年将增长至 981 亿美元,年复合增长率高达 32%。2023 年前 5 个月,生成式 AI 初创企业风险投资额已达 127 亿美元,较 2022 年的 48 亿美元大幅增长。

生物制药服务公司 Syneos HeAlth 的首席信息和数字官 Larry Pickett 表示,当前医疗数据训练模型的成本高达 100 万至 200 万美元。分析人士认为,特定领域的模型比通用模型更具价值,因为它们蕴含更多行业术语和专业知识。Pickett 期待通过使用小型预训练模型,大幅降低构建成本。“并非每个应用都需要 GPT-4,”Krishna 指出,大型语言模型正朝着精细化方向发展,未来将出现更小巧、可嵌入移动设备的模型,满足特定场景需求。

最新快讯

2026年02月07日

23:18
2026年1月,上海洋山港国际干线集装箱船舶进出港达834艘次,同比增长4.38%、环比增长5.04%,首次突破800艘次,创历史新高;当月集装箱吞吐量261.5万标准箱。此次增长得益于春节前外贸备货高峰及航线加密等举措,实现新年航运生产‘开门红’。
23:18
2026年春节期间(2月1日—2月7日),国家电网预测新能源汽车单日充电量峰值超3400万千瓦时,同比增长17%;高速充电量峰值超1100万千瓦时,同比增长超23%。高峰集中在2月14—15日及21—23日。江苏、浙江、安徽三省高速充电量将破纪录,长深、沈海、沪昆高速充电桩最繁忙。国家电网已部署5567个重点保障站点,并于2月12—23日通过“e充电”Ap...
23:18
2026年2月7日,安全研究员保罗发现AMD Windows驱动自动更新程序存在高危安全漏洞。该程序在下载驱动包时使用未加密HTTP连接,攻击者可通过劫持ati.com域名实施中间人攻击,利用更新进程的管理员权限执行恶意代码。漏洞已提交AMD,但官方以“MITM不在修复范围内”为由暂不处理。保罗通过逆向分析确认,更新列表虽经HTTPS获取,但实际下载链接为...
22:17
2026年2月7日,印度塔塔钢铁公司宣布正制定新一轮成本削减计划。此举旨在应对全球钢铁市场需求疲软及原材料价格波动压力,提升运营效率与盈利水平。计划涵盖优化产能布局、推进自动化升级及精简管理架构等措施,预计将在未来12个月内分阶段实施。公司强调该计划不涉及大规模裁员,而是侧重结构性调整与技术赋能。
22:17
2026年2月7日,位于四川省达州市高新区的达州燃气电站二期工程4号机组完成168小时满负荷试运行,正式投入商业运营。该项目由中国能建西南电力设计院总承包,二期新建2台700兆瓦H级燃机机组,与一期联合运行后总装机达210万千瓦,成为四川最大天然气发电基地。项目采用全球领先H级技术,联合循环效率达63.72%,创国内同类型能效新标杆。投运后年减排二氧化碳约...
22:17
2月7日,国网青海省电力公司在海拔约5000米的青海玉树地区成功实施超高压等电位带电作业。此次作业由国家电网青海超高压公司执行,系中国首次、世界最高海拔的500千伏超高压线路等电位带电检修。作业克服了低气压、缺氧、强紫外线等极端环境挑战,验证了高海拔复杂条件下带电作业技术可行性与安全性,为青藏高原电网安全稳定运行提供关键技术支撑。
21:47
2026年2月7日,极氪8X高性能版正式进入工信部最新新车公告。该车由吉利旗下高端品牌极氪推出,定位高性能新能源SUV,外观采用全黑运动设计,配备碳纤维套件、315mm宽胎及电动大尾翼,最高时速230km/h,并搭载红外夜视系统。动力预计搭载三电机系统,综合功率约1400马力,基于900V高压架构,智能平台为千里浩瀚H9与浩瀚AI数字底盘。新车将对标宝马X...
21:47
据悉,英特尔Arrow Lake Refresh桌面处理器三款型号——酷睿Ultra 7 270K Plus、Ultra 5 250K及250KF,将于2026年3月23日22:00全球评测解禁。原计划四款SKU中,旗舰Ultra 9 290K Plus或已取消发布,主因市场需求疲软及竞品(如AMD锐龙9 9950X3D)竞争加剧。华硕等厂商已为800系主...
21:47
2026年2月7日,广汽传祺正式开启2026款M8 HEV预售,尊贵版预售价22.98万元、至尊版24.98万元。新车搭载行业首创串并联两挡双电机混动系统,匹配2.0TM混动专用发动机,实现一箱油续航1057km。预售权益包括1000元抵8000元购车金、置换补贴10000元起、国家以旧换新补贴12000元、0首付5年期金融方案及老友专属权益。新车尺寸与现...
20:47
2026年2月7日,西班牙巴塞罗那足球俱乐部在巴塞罗那正式宣布退出欧洲超级联赛。此举由俱乐部董事会决议通过,旨在回应长期存在的法律与监管争议,以及维护西甲联赛及欧足联体系下的竞技公平性。巴萨强调将全力支持欧洲足球治理改革对话,并继续参与欧冠等现有赛事。退出即日生效,不设过渡期。
20:47
2026年2月5日,国际植物分类学期刊《Phytotaxa》发表我国植物新物种——铜壁关醉魂藤。该物种由中科院西双版纳热带植物园与云南铜壁关省级自然保护区管护局联合发现并命名,产于云南铜壁关自然保护区。属夹竹桃科醉魂藤属,形态特征与近缘种存在显著差异。研究人员在野外调查中确认其为未被描述的独立物种。目前已知醉魂藤属部分种类具催乳、除湿等药用价值,但铜壁关醉...
20:47
2026年2月7日,米兰-科尔蒂纳冬奥会开幕。本届奥运金牌含500克纯银加6克镀金,按2月6日金银现货价计算,物料价值达2210美元;银牌(500克纯银)为1251美元。此举刷新奥运金牌物料成本纪录,主因贵金属价格近期显著上扬。赛事组委会确认奖牌材质标准未变,但市场波动致实际价值攀升。