NVIDIA H100显卡刷新AI跑分记录性能远超竞品

2023-06-29 09:02:45 互联网 55 次阅读

快科技6月28日重磅消息，随着人工智能技术的迅猛发展，NVIDIA显卡已成为市场炙手可热的抢手货，尤其是旗舰级H100加速卡，即便售价高达25万元人民币也依然供不应求。这款显卡的性能表现更是令人惊叹，在最新的AI测试中创造了多项纪录，基于GPT-3的大语言模型训练任务时间已刷新至惊人的11分钟。

机器学习及人工智能领域开放产业联盟MLCommons近日发布了最新MLPerf基准评测报告，该报告涵盖了8项关键负载测试，其中特别包括了基于GPT-3开源模型的大语言模型测试，这对平台的AI性能提出了极高要求。参与此次测试的NVIDIA平台由896个Intel至强8462Y处理器和3584个H100加速卡组成，在所有参赛平台中是唯一完成全部测试并刷新纪录的。

在核心测试项目——基于GPT-3的大语言模型训练任务中，H100平台仅用时10.94分钟便轻松完成，这一成绩与Intel平台形成鲜明对比。Intel平台由96个至强8380处理器和96个Habana Gaudi2AI芯片构建，完成相同测试需要长达311.94分钟。从数据对比来看，H100平台的性能几乎是Intel平台的30倍，尽管两套平台的规模存在较大差异，但即便仅使用768个H100加速卡，训练时间也只需45.6分钟，依然远超Intel平台的AI芯片表现。

H100加速卡基于先进的GH100 GPU核心设计，采用定制版台积电4nm工艺制造，拥有800晶体管，集成了18432个CUDA核心、576个张量核心以及60MB二级缓存，并支持6144-bit HBM高带宽内存和PCIe5.0接口。这款计算卡提供SXM和PCIe5.0两种接口样式，其中SXM版本配备15872个CUDA核心和528个Tensor核心，PCIe5.0版本则拥有14952个CUDA核心和456个Tensor核心，最高功耗可达700W。

在性能指标方面，H100的表现堪称卓越：FP64性能达到260TFlops（每秒60万亿次），FP32性能高达2000TFlops（每秒2000万亿次），TF32性能达到1000TFlops（每秒1000万亿次），这三项指标均实现了对A100的三倍提升；而FP8性能则达到4000TFlops（每秒4000万亿次），更是A100的六倍。这些惊人的性能参数，使得NVIDIA H100加速卡成为人工智能领域当之无愧的顶级配置选择。

2026年02月27日

13:08

NVIDIA H100显卡刷新AI跑分记录性能远超竞品

最新快讯

2026年02月27日

生态环境部公布2026年超低排放改造目标及重点区域实施计划

沃尔核材引进16台进口发泡芯线挤出机高速线产能大幅提升

机器人租赁需求持续升温订单排至3月底覆盖全国多领域

天融信回应：Seedance 2.0暂未纳入安全防护服务范围

DHL京东签署备忘录共拓中德电商物流合作新篇章

利民股份与拜耳签署6年农化供货合同强化全球布局

2026款长安UNI-Z PHEV内饰曝光明日正式上市

豆包手机助手严正声明打击黑公关恶意炒作安全漏洞

哈佛研究破解篮球鞋吱吱声奥秘鞋底花纹精准控制发声频率

市场监管总局发布网络餐饮新规6月1日起实施重点解读

Anthropic收购视觉优先AI公司Vercept 加强具身智能与人机交互能力

浩纳光电完成超亿元B轮融资布局光通信与AI医疗新赛道

NVIDIA H100显卡刷新AI跑分记录 性能远超竞品

最新快讯

2026年02月27日

NVIDIA H100显卡刷新AI跑分记录性能远超竞品