AMD近日正式发布了备受期待的ROCm 7.0计算软件堆栈更新,这一重要升级显著增强了其对锐龙AI处理器及Radeon显卡的全面支持。新版本在AI推理任务性能上实现了突破性进展,官方公布的测试数据显示,搭载Instinct MI355X的AMD系统在DeepSeek R1基准测试中的FP8(半精度浮点)吞吐量,相较于NVIDIA的Blackwell B200 GPU实现了高达30%的领先优势。这一性能飞跃不仅彰显了AMD硬件与软件协同优化的强大实力,更在AI计算领域树立了新的标杆。
在上一代ROCm版本的基础上,本次更新的性能提升尤为突出。AMD通过深度优化底层驱动与计算内核,使得ROCm 7在处理多种大型AI模型时展现出惊人的性能表现。特别是在DeepSeek R1测试中,整体性能提升幅度达到了惊人的3.8倍,这一数据充分证明了AMD在AI计算领域的持续创新与领先地位。
除了性能上的重大突破,ROCm 7.0还带来了多项实用功能增强。新版本特别新增了对MI350系列GPU的全面支持,进一步扩大了AMD GPU的兼容范围。同时,该版本完美兼容Ubuntu 24.04等最新操作系统环境,为开发者提供了更加灵活稳定的开发平台。值得注意的是,ROCm 7.0集成了PyTorch、TensorFlow等主流AI框架的最新版本,并通过优化框架适配层显著提升了大规模AI模型部署的效率与稳定性,为科研机构与企业用户提供了强大的技术支撑。
AMD此次ROCm 7.0的发布,不仅巩固了其在开源AI计算领域的领导地位,更通过持续的技术创新,为AI开发者提供了更加公平高效的竞争环境。随着更多用户采用锐龙AI处理器与Radeon显卡构建高性能计算平台,AMD有望在AI算力市场迎来新的发展机遇。