
继学术界接连孵化出多个现象级 AI 引擎后,开源推理框架 vLLM 的核心成员正式宣布成立初创公司 Inferact。这家新晋企业以高达 8 亿美元的投前估值,成功完成了 1.5 亿美元的种子轮融资,强势开启了 AI 推理技术的商业化征程。顶级资本的鼎力支持,不仅为 Inferact 注入了强劲动力,更标志着 AI 行业正经历一场深刻的变革——重心正从传统的“模型训练”全面转向前景广阔的“应用推理”领域。
本轮融资由知名风险投资机构 Andreessen Horowitz(a16z)和 Lightspeed Venture Partners 联合领投,这一举动不仅印证了市场对于 vLLM 商业化路径的深度关注,更凸显了 AI 推理技术商业价值的巨大潜力。随着 Inferact 的正式成立,AI 推理技术的商业化进程将迎来加速器,为行业带来更多创新与突破。

Inferact 的核心技术 vLLM 孵化自加州大学伯克利分校 Ion Stoica 教授的实验室,这位 Databricks 联合创始人的学术背景为 Inferact 注入了强大的技术基因。vLLM 通过创新的显存管理技术,能够显著提升大模型的运行速度并降低能耗,为 AI 应用的实时性和经济性提供了革命性的解决方案。这一技术优势已获得市场的高度认可,vLLM 的开源版本已被亚马逊云服务(AWS)及亚马逊购物等业界巨头广泛采用,充分证明了其技术的成熟度和实用性。
在 CEO Simon Mo 的带领下,Inferact 凭借 vLLM 技术在推理赛道崭露头角。其亮相紧随 RadixArk 之后,后者由知名框架 SGLang 商业化而来,近期刚获得 Accel 领投的 4 亿美元融资,投前估值高达 4 亿美元。两家公司均出自伯克利实验室,这一系列接连的获投事件反映出投资者正不惜重金,抢占更快速、更经济的 AI 部署技术高地。这一趋势不仅推动了 AI 推理技术的快速发展,也为整个行业带来了新的机遇和挑战。
