a16z领投Inferact 1.5亿美金战AI推理成本压缩

继学术界接连孵化出多个现象级 AI 引擎后,开源推理框架 vLLM 的核心成员正式宣布成立初创公司 Inferact。这家新晋企业以高达 8 亿美元的投前估值,成功完成了 1.5 亿美元的种子轮融资,强势开启了 AI 推理技术的商业化征程。顶级资本的鼎力支持,不仅为 Inferact 注入了强劲动力,更标志着 AI 行业正经历一场深刻的变革——重心正从传统的“模型训练”全面转向前景广阔的“应用推理”领域。

本轮融资由知名风险投资机构 Andreessen Horowitz(a16z)和 Lightspeed Venture Partners 联合领投,这一举动不仅印证了市场对于 vLLM 商业化路径的深度关注,更凸显了 AI 推理技术商业价值的巨大潜力。随着 Inferact 的正式成立,AI 推理技术的商业化进程将迎来加速器,为行业带来更多创新与突破。

a16z领投Inferact 1.5亿美金战AI推理成本压缩插图1

Inferact 的核心技术 vLLM 孵化自加州大学伯克利分校 Ion Stoica 教授的实验室,这位 Databricks 联合创始人的学术背景为 Inferact 注入了强大的技术基因。vLLM 通过创新的显存管理技术,能够显著提升大模型的运行速度并降低能耗,为 AI 应用的实时性和经济性提供了革命性的解决方案。这一技术优势已获得市场的高度认可,vLLM 的开源版本已被亚马逊云服务(AWS)及亚马逊购物等业界巨头广泛采用,充分证明了其技术的成熟度和实用性。

在 CEO Simon Mo 的带领下,Inferact 凭借 vLLM 技术在推理赛道崭露头角。其亮相紧随 RadixArk 之后,后者由知名框架 SGLang 商业化而来,近期刚获得 Accel 领投的 4 亿美元融资,投前估值高达 4 亿美元。两家公司均出自伯克利实验室,这一系列接连的获投事件反映出投资者正不惜重金,抢占更快速、更经济的 AI 部署技术高地。这一趋势不仅推动了 AI 推理技术的快速发展,也为整个行业带来了新的机遇和挑战。

最新快讯

2026年01月23日

11:54
人工智能技术的双重影响再次在全球范围内掀起波澜。由埃隆·马斯克创立的 xAI 公司开发并整合于 X 平台上的 AI 助手 Grok,因近期推出的图片编辑功能而深陷舆论漩涡和法律困境。这一引发争议的功能允许用户通过简单的文字指令,例如“让她穿上比基尼”或“脱掉她的衣服”,对真实人物的照片进行修改。反数字仇恨中心(CCDH)发布的最新研究报告显示,该工具在短短 ...
11:54
OpenAI 近期卷入了一场备受关注的政治立场争议,再次成为舆论焦点。据权威科技媒体 AIbase 深度报道,针对外界普遍质疑公司管理层过度偏向自由派、甚至被指打造"觉醒 AI(Woke AI)"的言论,OpenAI 营销主管 Kate Rouch 在社交平台 X 上公开发声进行有力反驳,系统性地论证了公司领导层的政治多元化格局。 这场争议的导火索源于 MA...
11:54
财联社1月23日独家消息,全球电商巨头亚马逊即将启动新一轮史无前例的大规模裁员计划,预计从下周起将逐步终止部分员工的雇佣关系。这一消息传出后引发市场震动,因为距离亚马逊上次宣布裁减1.4万个职位仅过去了短短数月,此次行动无疑标志着其内部结构优化和效率提升的进程正在加速推进。 据内部知情人士透露,本轮裁员波及范围可能高达1.6万人,创下公司历史新高。与以往不同...
11:54
阿里通义千问团队昨晚震撼发布了Qwen3-TTS系列语音生成模型家族的开源成果,这一突破性进展迅速点燃了开源社区的热情,被业界誉为语音合成技术的里程碑式创新。该系列模型采用先进的端到端架构,实现了秒级音色克隆、自然语言驱动的音色设计以及实时流式音频输出,为实时语音应用扫清了技术障碍。 Dual-Track双轨架构突破延迟极限Qwen3-TTS的核心突破在于其...
11:54
在开发者与AI编码助手共同构建的代码丛林中,沟通不畅往往成为最大的阻碍。开发者绞尽脑汁描述UI组件的位置,而AI却像在茫茫代码海洋中迷失方向,难以找到那个位于左侧侧边栏、带有蓝色悬浮效果的按钮究竟藏在哪个文件里。这种低效的沟通模式如同盲人摸象,令人沮丧。但今天,这一困境终于有了完美的解决方案。由Benji Taylor、Dennis Jin与Alex Van...
11:53
近日,湖南怀化上演了一幕令人又惊又喜的救援场景。一名活泼的男孩在玩耍密码锁时,竟不慎将金属锁扣卡在了自己的鼻尖上,瞬间变身成为模样酷似“牛魔王”的奇特造型。这一意外瞬间让在场家长心急如焚,立即带着孩子赶往当地消防队寻求帮助。 现场视频画面令人印象深刻。黑色的密码锁如同一个顽固的“咬合器”,紧紧地嵌在男孩的鼻尖部位,孩子因疼痛难忍而不断皱眉,那既令人心疼又好笑...
11:45
1月22日,森海塞尔正式向海外市场推出备受期待的RS275电视耳机套装,该套装特别配备了BTA1数字接收器,为用户带来卓越的音频体验。这款产品基于先进的Auracast广播式蓝牙音频技术,确保在50米范围内实现超低延迟的稳定传输,并且完美兼容各类助听器、智能扬声器等终端设备,为不同用户群体提供全方位的解决方案。 RS275电视耳机套装在续航能力上表现出色,单...
11:45
2026年1月23日,运动手表巨头佳明正式回应了用户关于Fenix 8 AMOLED手表在暗光环境下自动亮度调节过暗的集中投诉。公司明确表示,这一设计行为系"有意为之",核心目的是通过内置环境光传感器动态调整屏幕亮度,从而在昏暗场景中降低蓝光辐射,有效保护用户的视网膜健康。这一回应迅速在科技爱好者社群中引发热议,其背后则源于一位网友Horgh在佳明官方社区发...
11:45
1月22日,《明日方舟:终末地》全球公测迎来首日,却遭遇了支付系统突发故障。据官方公告显示,PayPal支付渠道出现了订单与实际物品交付不符的技术问题。这一故障主要影响了通过官方启动器及topup.gryphline.com平台使用PayPal完成充值的少数玩家,受影响订单数量极为有限。 事件发生后,运营团队迅速启动应急预案,第一时间禁用了PayPal支...
11:45
2026年1月23日,全球领先的数字支付平台PayPal正式宣布达成一项战略性收购交易,成功并购以色列创新企业Cymbio——一家专注于多渠道电商协同管理的顶尖技术平台。此次交易标志着PayPal在AI驱动购物领域的重要布局,旨在通过整合Cymbio的先进技术,显著提升其在智能购物渠道中的商户服务能力。 Cymbio总部坐落于科技创新之都以色列,为全球品牌提...
11:45
2026年1月22日,人工智能领域迎来重大突破——英矽智能正式发布革命性框架Science MMAI Gym,专为提升大语言模型在生物化学领域的专业能力而设计。这一创新框架通过整合领域特定数据集、多任务微调技术、强化学习算法以及全面的基准评测体系,精准聚焦于药物化学、生物学和临床开发三大核心领域,旨在打造具备超凡专业素养的生物化学AI助手。 在功能设计上,S...
11:45
2025年,中国电子商务发展再创辉煌,商务部电子商务司于2026年1月23日发布了权威数据报告。全年实物商品网上零售额实现5.2%的稳健增长,这一成绩不仅为国内社会消费品零售总额增长贡献了36.2%的强劲动力,更连续13年将中国稳居全球电子商务规模榜首的领先地位。在各类商品中,手机和智能机器人线上销售额分别飙升20.5%和18%,展现出消费升级趋势下的强劲市...