
京东云JoyBuilder模型开发平台近日迎来重大突破性升级,成功支持业界顶尖模型GR00T N1.5完成千卡级训练任务。这一里程碑事件使JoyBuilder成为全球首个支持具身智能千卡级LeRobot开源训练框架的AI开发平台,更在训练效率上实现革命性飞跃,较开源社区版本提升高达3.5倍。通过软硬件深度协同优化和算法层面的创新突破,JoyBuilder平台显著提升了模型训练效率与稳定性,将原本需要15小时完成的1亿多数据千卡训练缩短至仅需22分钟,为具身智能技术迈向规模化落地应用注入强大动力。
为达成这一效率突破,京东云AI Infra团队对JoyBuilder平台进行了全栈深度优化。在具身数据链路优化方面,平台重构了数据预处理与加载流程,创新性地实现CPU数据处理与GPU计算的异步执行模式,大幅缩短等待时间;针对海量具身小数据文件存储需求,自研的高性能并行文件系统云海JPFS通过分布式元数据管理机制和智能预取技术,在1024卡集群上实现超过400GB/s的读取带宽,确保数据持续高速供给。在具身模型计算优化方面,团队针对主流VLA(视觉-语言-动作)模型的计算特性,从Attention层优化、Token动态裁剪和训练后量化等维度进行全方位极致优化。此外,在具身模型基础设施建设上,平台搭建了3.2T RDMA后端网络,通过多轨道优化策略、拓扑感知调度算法和智能震荡抑制技术,确保千卡规模集群间集合通信的高吞吐与低延迟,为长周期训练提供稳定运行保障,同时借助云原生AI数据湖技术优化数据调度与流水线,进一步提升端到端处理效率。

通过全链路系统性优化,JoyBuilder平台已全面支持业界当前最主流的LeRobot训练数据最新协议标准,不仅显著加速了具身智能模型的开发迭代进程,更确立了其在具身智能AI开发平台领域的行业领先地位。这一突破性进展将有效降低具身智能技术的应用门槛,推动相关技术在工业自动化、智能机器人等领域的创新应用,为产业智能化转型提供强大技术支撑。
