
微新创想:5 月 6 日 人工智能领军企业 OpenAI 联合 AMD、博通(Broadcom)、英特尔、微软及英伟达等多家行业巨头 共同推出了一项名为“多路径可靠连接”(Multipath Reliable Connection 简称 MRC)的全新开放网络协议 这一动作标志着科技界在解决超大规模 AI 集群效率瓶颈上迈出了关键一步
该协议的核心目标在于通过技术手段优化大型 AI 训练集群的运行表现 在以往的模型训练中 由于网络连接的波动或分配不均 昂贵的 GPU 算力往往会因为等待数据传输而产生闲置 造成了极大的资源浪费 MRC 协议通过提供更具可靠性的多路径连接方案 旨在显著提升数据传输的稳定性 从而大幅降低功耗并提高整体计算效率
据了解 MRC 协议并非仅停留在理论阶段 目前已在 OpenAI 内部得到全面应用 所有用于开发前沿模型的大型超级计算机均已部署该协议 其中涵盖了位于美国德克萨斯州阿比林的甲骨文云基础设施(OCI)站点 以及微软旗下的 Fairwater 超级计算机集群
随着 AI 模型参数规模的持续攀升 底层基础设施的效率优化已成为各家大厂争夺的新战场 此次 OpenAI 选择与多家硬件芯片厂商及云服务商联合发布开放协议 不仅为了解决自身训练成本问题 更展现了其试图主导 AI 时代网络通信标准的意图
对于行业而言 MRC 的发布或许将推动超大规模算力集群进入一个更高效 更绿色的新阶段
