华为发布AI突破技术降低对HBM内存依赖

2025-08-10 16:09:10 互联网 128 次阅读

微新创想8月10日重磅消息，华为即将在8月12日举办的2025金融AI推理应用落地与发展论坛上，重磅发布AI推理领域的革命性技术突破。据行业深度消息透露，这一突破性成果有望从根本上降低中国AI推理对HBM（高带宽内存）技术的依赖，显著提升国内AI大模型推理性能，并完善中国AI推理生态的关键环节。

HBM（High Bandwidth Memory，高带宽内存）是一种基于3D堆叠技术的先进DRAM解决方案，通过将多层DRAM芯片垂直集成，实现了数据传输效率的飞跃。它具备超高带宽与低延迟、高容量密度、高能效比等突出优势，成为推动AI技术发展的关键硬件支撑。

在AI推理过程中，系统需要频繁调用海量模型参数（如千亿级权重）和实时输入数据。HBM的高带宽和大容量特性，使得GPU能够直接访问完整的模型数据，有效避免了传统DDR内存因带宽不足而导致的算力闲置问题。对于参数量超过千亿的大模型，HBM能够显著提升系统的响应速度，优化推理效率。

目前，HBM已成为高端AI芯片的标配配置，在训练侧的渗透率已接近100%。随着模型复杂度的不断提升，HBM在推理侧的普及速度也在加速。然而，当前HBM产能紧张的局面，叠加美国方面的出口限制措施，正倒逼国内厂商积极探索Chiplet封装、低参数模型优化等替代方案，以突破技术瓶颈，实现自主可控。

此次华为即将发布的AI推理技术突破，无疑将为国内AI产业注入新的活力，推动中国在AI推理领域的技术自立自强，为构建完善的AI推理生态体系奠定坚实基础。这一突破性成果的问世，将为中国AI产业的未来发展开辟新的道路，助力中国在全球AI竞争中占据更有利的位置。

2025年11月18日

18:30