国产算力新里程碑 摩尔线程MTT S5000高效推理DeepSeek V3 671B大模型性能逼近国际顶尖

国产AI芯片与大模型协同优化迎来历史性突破。近日,摩尔线程与硅基流动联合宣布,基于国产GPU MTT S5000,成功完成对千亿参数大模型DeepSeek V3 671B“满血版”的深度适配与性能验证。这一成果不仅彰显了国产AI技术的快速进步,更标志着国产算力生态正迈向高效运行的新阶段。

通过创新应用FP8(8位浮点)低精度推理技术,实测性能表现令人瞩目:单卡Prefill(预填充)吞吐量突破4000 tokens/秒,Decode(解码)吞吐量超过1000 tokens/秒,整体推理速度已接近国际主流高端AI加速卡水平。这一突破意义重大。DeepSeek V3 671B作为国内领先的开源大模型,参数规模庞大、推理负载极高,此前多依赖英伟达A100/H100等高端GPU部署。此次在完全国产化硬件平台上实现高效运行,不仅验证了摩尔线程MTT S5000在大模型推理场景下的真实能力,更打破了国外技术的垄断。

关键技术突破在于FP8低精度推理的深度优化。FP8技术在保持模型精度损失极小的前提下,可显著提升计算吞吐、降低显存占用与功耗。摩尔线程与硅基流动联合完成了从底层驱动、算子库到推理引擎的全栈调优,使MTT S5000充分发挥FP8硬件加速潜力,有效支撑了大模型高并发、低延迟的推理需求。

对于行业而言,这意味着国产替代路径进一步清晰:高性能大模型不再必须绑定海外高端芯片。在当前全球算力供应链不确定性的背景下,MTT S5000 + DeepSeek V3的组合为金融、政务、能源等关键领域提供了高性价比、高安全性的本土化AI部署选项。

尽管在绝对峰值性能或软件生态成熟度上,国产GPU与国际顶尖产品仍有差距,但此次实测数据表明,在特定高价值场景下,国产方案已具备实用化竞争力。随着软硬件协同优化持续深入,中国AI基础设施的自主可控能力正加速成型——从“可用”到“好用”,只差一次又一次这样的实测突破。

最新快讯

2026年01月22日

11:56
声明:本文来自于微信公众号 壹娱观察,作者:王心怡,授权站长之家转载发布。如果以长视频商业化的发展轴线来看,2025年算得上某种意义的回落期。剧集方面,尽管不少流量主演剧集屡屡被各方号称刷新平台招商纪录,40+、50+合作品牌数整齐罗列,化作开播前和播后总结的耀眼成绩单,但是,一方面开播剧集的单集赞助数量明显在减少、满档登场的情...
11:55
微新创想1月22日消息,昨日(1月21日),北京新东方退休俱乐部”账号在社交平台上线,其主要面向北京50-75岁退休人群推出兴趣课程与本地社交活动。在招募贴中,官方介绍了退休俱乐部开设北京本地活动、兴趣课程等内容,全程由80后”90后”年轻人做活动玩伴,每月组织2次小聚会、免费提供3门兴趣课。在账号主页课程介绍中,目前显示线上课...
11:55
微新创想1月22日消息,今日,小米社区发布公告,正式公布小米澎湃OS 3 Beta第二期招募计划。据了解,小米澎湃OS 3 Beta第二期首波机型1月22日开启招募,第二波机型将于1月30日前开启招募。1月22日开启招募手机:小米17 Ultra、小米17 Pro Max、小米17 Pro、小米17、REDMI K90 Pro ...
11:55
微新创想1月22日消息,智界汽车公布称智界R7纯电Ultra版的风阻系数为0.217,该成绩获中国汽研权威认证,创下全球量产SUV最低风阻”记录。智界R7能达到如此低的风阻系数,源于20余项空气动力学创新设计,它采用了低趴轿跑SUV溜背设计,配有主动进气格栅 (AGS),可根据车速和散热需求自动调节开合角度,降低高速行驶风阻。此...
11:23
近日,一位来自吉林的年轻游客在哈尔滨冰雪大世界遭遇意外冻伤事件,迅速引发全网热议。1月21日,当事人姜同学通过社交媒体分享了自己的亲身经历,并发出强烈提醒:计划前往哈尔滨冰雪大世界的游客必须高度重视保暖措施。姜同学表示,自己在吉林生活了16年,对当地冬季气候有着充分了解,以往冬季出游从未出现过冻伤情况,因此此次前往哈尔滨时并未对低温环境做好充分准备。 1月某...
11:23
微新创想1月22日讯 近期国际金价持续攀升,昨日现货黄金价格创历史新高,首次突破4800美元/盎司整数大关,日内涨幅高达1.48%。受此影响,国内黄金市场也同步水涨船高。1月21日,周大福、周生生等一线珠宝品牌纷纷上调足金饰品价格,报价区间锁定在1495-1506元/克,涨幅明显。 然而,在这股金价上涨的浪潮中,胖东来时代广场门店却展现出独特的市场竞争力。...
11:09
2026年1月22日,国内领先的工业碳排放数据量化云计算企业易碳数科正式宣布成功完成A++轮融资,总金额高达数亿元人民币。此次融资由实力雄厚的北京国能基金独家领投,标志着易碳数科在绿色低碳科技创新领域又迈出了坚实一步。 易碳数科作为一家专注于工业制造业碳排放数据量化与云计算的科技公司,凭借其深厚的技术积累和行业洞察力,已逐步成为流程制造行业碳数据管理领域的标...
11:09
2026年1月21日,备受瞩目的音频品牌马歇尔正式发布了旗下全新音乐流媒体中枢——Heddon,这款创新设备以300美元(约合人民币2093元)的售价,为音乐爱好者们带来了前所未有的多房间音频同步体验。Heddon的核心亮点在于其采用的Auracast技术,该技术能够无缝连接多台旧款马歇尔音箱,实现精准的音频同步播放,让家庭音乐系统焕发新生。目前,Heddo...
11:09
2026年1月22日,忆联科技正式发布全新企业级SATA固态硬盘UM311d,为数据中心和关键业务系统提供卓越的存储性能与可靠性解决方案。这款基于先进3D TLC闪存技术的硬盘,凭借其出色的写入耐久度与高速数据传输能力,迅速成为企业级存储市场的焦点产品。 UM311d提供四种灵活的容量选择,从480GB到3.84TB,满足不同规模企业的存储需求。其1DWPD...
11:09
2026年1月22日,专注于精准健康服务的创新企业一元长寿成功斩获数千万元天使轮融资。此次投资由知名风险投资机构见微投资与菁致资本联合领投,充分彰显了资本市场对衰老干预领域的热切期待。一元长寿作为行业先行者,始终致力于将前沿科技与健康理念深度融合,通过构建科学的长寿科技服务体系,为用户带来全方位的健康管理体验。 本轮融资所得资金将重点投向三大核心领域。首...
11:09
2026年1月22日,拼多多正式官宣启动备受瞩目的“春节不打烊”专项活动,活动时间精准覆盖传统春节假期,具体为2月7日至2月24日。此次活动旨在鼓励广大商家抓住节日期间的消费黄金期,平台将提供全方位流量扶持与资源倾斜。商家可根据自身经营情况,灵活设置专属服务标识参与活动,从而获得更多曝光机会。 平台方面将实施精细化流量加权机制,对报名参与的商品在搜索结果...
11:09
2026年1月22日,丰田汽车宣布因突降大雪影响,将临时暂停日本部分生产线的运营。受影响区域覆盖日本国内多个核心生产基地,包括丰田汽车宫崎工厂、爱知工厂等关键制造设施。由于降雪导致道路通行受阻,部分生产设备安全运行面临挑战,同时物流运输也遭遇严重瓶颈。此次紧急停产是丰田基于安全第一原则做出的决策,旨在确保所有员工的人身安全,并有效应对极端天气可能引发的运营风...