微软Azure ND GB300v6创纪录每秒推理达110万token - 微新创想

2025-11-04 17:24:05 AI动态 7 次阅读

微软近日震撼宣布，其Azure ND GB300v6虚拟机在Meta的Llama270B模型上实现了每秒110万token的行业新纪录，这一突破性成就标志着人工智能推理性能的全新里程碑。微软首席执行官萨提亚·纳德拉在社交媒体上盛赞这一成就，表示这是微软与英伟达长期深度合作以及在生产规模运行人工智能方面专业知识的完美结晶。

Azure ND GB300虚拟机采用英伟达的Blackwell Ultra GPU，具体为NVIDIA GB300NVL72系统，配置了72个NVIDIA Blackwell Ultra GPU和36个NVIDIA Grace CPU，采用单机架构设计。这款虚拟机专为推理工作负载优化，具有50%的GPU内存提升和16%的热设计功率（TDP）提高，为人工智能推理提供了前所未有的性能支持。

为了验证性能提升，微软在一个NVIDIA GB300NVL72域下的18台ND GB300v6虚拟机上运行了Llama270B（FP4精度）模型，使用NVIDIA TensorRT-LLM作为推理引擎。微软自豪地表示，一个NVL72机架的Azure ND GB300v6实现了总计110万个token每秒的推理速度，这一新记录超越了微软之前在NVIDIA GB200NVL72机架上实现的865，000token每秒的成绩。

根据系统配置，每个GPU的性能大约为15，200token每秒，这一性能表现令人瞩目。微软还提供了详细的模拟过程和所有日志文件及结果，确保了数据的透明度和可信度。该性能记录经过了独立的性能验证和基准测试公司Signal65的严格验证。

Signal65的实验室副总裁拉斯·费洛斯在博客中指出，这一里程碑不仅突破了每秒百万token的障碍，还在一个能够满足现代企业动态使用和数据治理需求的平台上实现。他补充道，Azure ND GB300相较于上一代NVIDIA GB200在推理性能上提升了27%，而仅增加了17%的功率规格，这一性能提升与功率效率的平衡堪称业界典范。

与NVIDIA H100代相比，GB300在推理性能上几乎提升了10倍，同时在机架级别的功率效率上提高了近2.5倍，这一性能飞跃为人工智能行业树立了新的标杆。微软Azure ND GB300v6虚拟机的这一突破性成就，不仅展现了微软在人工智能领域的领先地位，也为全球企业提供了更高效、更强大的AI推理解决方案。

🚀 微软Azure ND GB300v6虚拟机实现每秒推理110万token，创造行业新纪录。
💻 该虚拟机配置72个NVIDIA Blackwell Ultra GPU和36个NVIDIA Grace CPU，专为推理优化。
📈 相比上一代，Azure ND GB300在推理性能上提升27%，功率效率提升近2.5倍。

2025年11月05日

00:33

Anthropic获130亿美元融资目标2028年营收700亿

2025年9月，人工智能领域的领军企业Anthropic PBC传来振奋人心的消息，成功完成了一轮高达130亿美元的巨额融资。这场资本盛宴吸引了众多知名投资者的目光，共同为这家创新驱动型公司注入强劲动力，旨在加速其前沿技术研发与全球业务布局。据悉，Anthropic PBC正以惊人的速度推进生成式AI技术的商业化进程，并制定了雄心勃勃的增长目标。根据公司最新...

00:33

2025印度恰蒂斯加尔邦火车相撞致5死14伤救援紧张

2025年11月4日傍晚时分，印度恰蒂斯加尔邦突发严重铁路交通事故，引发社会广泛关注。当日16时许，一列正常运行的客运列车在行至某路段时，与前方突然停靠的货运列车发生猛烈相撞。这场突如其来的灾难已造成重大人员伤亡，初步统计确认至少5名乘客不幸遇难，另有14人受伤送医。令人担忧的是，其中部分伤者伤势严重，生命垂危，情况不容乐观。据现场救援人员透露，事故还导致至...

00:33

卓胜微多款模组产品迎快速增长产能提升助推毛利修复

2025年11月4日，卓胜微正式发布投资者关系活动记录表，向外界清晰传递了公司经营状况逐步向好的积极信号。当前，行业需求景气度呈现显著提升态势，叠加传统淡旺季的周期性转换，客户集中采购动能明显增强，为卓胜微的业绩增长注入强劲动力。在第三季度财报中，公司特别指出芯卓自产晶圆成本对毛利率的拖累效应已呈现环比改善趋势，这一关键指标的优化预示着公司盈利能力正逐步恢复...

00:33

中国东盟跨境电力互济超750亿千瓦时绿电合作深化

2025年11月4日，第七届东亚峰会清洁能源论坛传来重要消息，中国与东盟国家在能源领域的合作正迈向全新高度，展现出持续深化的良好态势。近年来，双方跨境电力互济的成果显著，累计电量已突破750亿千瓦时，其中绿色电力占比更是高达90%以上，彰显了双方在推动清洁能源发展方面的坚定决心和显著成效。截至目前，中国企业在东盟地区参与的能源电网项目数量已超过190个，累...

00:00

医保智能监管升级 50种易倒卖药品纳入重点监测体系

国家医保局近日发布重要通知，全面升级超量开药智能监管体系，旨在严厉打击医保药品倒卖与回流乱象。根据最新部署，全国试点地区将在今年12月底前，率先将至少50种高风险医保药品纳入智能监管网络，构建起精准高效的防控屏障。通知明确划定三类重点监控行为：一是无医学指征的过度购药行为，二是跨医疗机构重复购药现象，三是冒用他人身份购买药品的欺诈行为。医保部门将通过先...

00:00

Nothing 3a Lite首发吐槽预装广告难卸载 Meta服务引争议

Nothing Phone (3a) Lite 作为品牌首款搭载预装应用的机型，自发布以来便引发了广泛的讨论和争议。这款手机实际上是基于 CMF Phone 2 Pro 的换壳版本，最初凭借纯净的安卓系统和极具竞争力的性价比赢得了市场的关注。然而，首批用户在体验过程中发现了一些令人不满的问题——系统设置中突然出现了“App 推荐”页面，并且首次引入了锁屏广告...

00:00

康宁揭秘1650℃玻璃诞生：大猩猩玻璃研发全纪录

科技媒体 Android Authority 近期深入探访康宁纽约研发中心，首次揭开了手机屏幕玻璃从无到有的完整诞生过程。在高达1650℃的熔炉中，经过特殊配比的原材料通过精密的"熔融拉伸法"被塑造成两片晶莹剔透的玻璃膜。这种独特的制造工艺不仅赋予了玻璃优异的平整度，更为其后续的卓越性能奠定了坚实基础。通过先进的空中冷却成型技术，康宁确保每一片玻璃表面都能...

00:00

诺和诺德加码86美元收购Metsera医药公司交易引关注

2025年11月4日，全球知名医药企业Metsera Inc正式对外宣布，已收到来自诺和诺德公司提交的最新收购方案，该方案提出以每股86.20美元的价格进行交易。这一报价相较于Metsera于11月3日收盘价60.73美元的市值，展现出显著的优势，为市场带来重大震动。Metsera管理层在审慎评估后，明确表示此次更新后的收购提议已达到"更优"标准，显示出双方...

00:00

零跑汽车否认一汽收购传闻消息不实官方澄清

11月4日，针对近期流传的一汽集团将入股零跑汽车并成为其第一大股东的传闻，零跑汽车方面迅速作出官方回应，明确表示该消息纯属不实。此前有市场消息传出，称一汽集团计划通过定向增发的方式收购零跑汽车部分股权，且相关方案已获得内部批准，预计将于11月17日正式对外官宣。然而，零跑汽车方面对此予以坚决否认，强调该计划并不存在。目前，双方均未就任何正式合作进展进行公开披...

2025年11月04日

22:59

Redmi Turbo 5首发天玑8500 1月登场性能强悍

Redmi Turbo 5首发天玑8500 1月登场性能强悍

微新创想11月4日最新消息，知名数码博主数码闲聊站率先爆料，备受关注的天玑8系中端性能机预计将在2024年1月正式亮相，这一消息也间接证实了备受期待的REDMI Turbo 5将在同月发布。据博主透露，REDMI Turbo 5将首发搭载全新天玑8500芯片，这颗备受瞩目的中端旗舰芯片采用台积电先进的4nm工艺制程，其CPU部分采用8核A725全大核设计，超...

22:59

流浪地球3吴京回归刘培强或将复活2027大年初一上映

《流浪地球3》于4月15日正式拉开拍摄帷幕，导演郭帆携手主演吴京、沈腾共同出席了盛大的开机仪式。这部备受瞩目的科幻巨制预计将于2027年大年初一与全球观众见面，开启新一轮的宇宙冒险。近日，吴京在社交平台上惊喜发布了身穿宇航服的剧照，并配文"生无可恋3"，瞬间引发全网热议。这一细节被广泛解读为吴京饰演的角色刘培强将在第三部中强势回归。作为系列前作中牺牲的...

22:59

零跑否认被一汽收购传闻官方称合作聚焦战略层面

近日，关于“一汽集团将通过定向增发收购零跑汽车并成为其第一大股东”的传闻在业界引发广泛关注。对此，零跑汽车方面及创始人朱江明均通过官方渠道明确辟谣，强调该消息纯属不实信息。尽管此前有媒体爆料称该收购方案已获相关部门批准，并计划于11月17日正式官宣，但零跑方面始终保持着谨慎的态度。目前，零跑汽车与一汽集团的合作仍聚焦于战略层面，双方在多个领域已取得显著进展...