
在2025年 AWS re:Invent 大会上的重磅发布,亚马逊云科技(AWS)正式推出了划时代的人工智能训练芯片——Trainium3。这款新一代芯片不仅在性能上实现了飞跃式突破,更在AI模型训练领域开辟了全新的可能性。根据AWS的详细解读,Trainium3芯片采用了业界领先的3纳米先进制程工艺,其计算性能较上一代产品实现了惊人的4倍提升,内存容量同样增长4倍,而能效比则显著提高40%。这一系列革命性的改进使得Trainium3能够完美胜任高负载推理和大规模AI训练任务,为各行各业的应用落地提供了强大的算力支撑。
此次发布的Trainium3UltraServer系统更是展现了AWS在AI基础设施领域的雄心。该系统能够构建超大规模计算集群,最多可连接高达100万颗Trainium3芯片,这一数字是前代系统的10倍,真正实现了AI算力的指数级扩展。每台UltraServer机箱最多可容纳144颗芯片,极大地提升了数据处理吞吐能力。亚马逊方面强调,该系统的推出将显著降低客户使用AWS AI云服务时的推理成本,加速AI技术在各行业的渗透与应用。
值得关注的是,AWS还披露了下一代芯片Trainium4的研发蓝图。据透露,Trainium4将突破性地支持与英伟达GPU的协同工作模式。通过集成英伟达的NVLink Fusion高速互连技术,Trainium4不仅能够实现整体性能的倍增,还能充分发挥亚马逊自研的低成本服务器架构优势。这一战略举措有望大幅降低现有基于英伟达优化的AI应用迁移至亚马逊云平台的门槛,为开发者提供更灵活的选择空间。
划重点:
🌟 Trainium3性能提升4倍,内存和能效分别增至4倍和40%
🔗 UltraServer系统可搭载100万颗芯片,支持超大规模集群构建
🚀 Trainium4将支持与英伟达GPU协同工作,降低AI应用迁移门槛
