京东近日重磅发布了一项突破性的技术成果——基于国产芯片自主研发的大模型推理引擎 xLLM 开源计划。这一创新举措标志着国内 AI 技术生态迈入新阶段,将为企业部署 AI 应用提供前所未有的性能与成本优势,有力加速产业智能化升级进程。
xLLM 引擎凭借多项核心功能亮点脱颖而出。其自主研发的请求优先级动态调度器能够智能匹配任务权重与计算资源,确保高优先级任务优先执行。更为突出的是,引擎采用的动态自适应 PD 分离架构可根据实时负载自动调节处理实例比例,实现资源利用率最大化。针对多模态场景的复杂需求,xLLM 配备了 EPD 混合分离调度器,为 AI 应用的灵活部署提供强大支持。
在技术架构层面,xLLM 创新性地设计了基于硬件特性的多级流水线执行引擎,显著提升任务处理效率。开发者团队还构建了包含图融合、投机推理和动态负载均衡的计算优化套件,进一步突破 AI 推理性能瓶颈。通过 Mooncake 构建的多级 KV 缓存全局管理系统,数据处理流程得到全面优化,为复杂场景提供极致流畅的体验。
京东方面透露,xLLM 技术源于零售核心业务实践,已成功应用于京东 AI 助手、智能客服、风控系统及供应链管理等多个关键场景。实测数据显示,该系统可将处理效率提升5倍以上,同时将机器成本降低90%,充分验证了其技术领先性。
“我们坚信 AI 基础设施生态建设需要全行业共同参与。”京东零售 AI 基础设施团队表示,”开源只是起点,未来将持续根据社区反馈开放更多高级功能,并与清华、北大、中科大等顶尖产学研伙伴深化合作,共同推动国产 AI 基础设施技术突破。”
随着 xLLM 开源计划的正式启动,全球开发者将获得体验这一前沿技术的宝贵机会。这一举措不仅将加速中国 AI 技术生态建设,更将激发更多创新应用场景的涌现,为全球 AI 技术发展注入中国力量。