AI自动生成Metal内核 PyTorch推理速度提升87%创纪录

在苹果设备上,AI 技术正掀起一场性能革命。根据 Gimlet Labs 最新发布的研究报告,AI 能够自动生成优化的 Metal 内核,将 PyTorch 推理速度提升至惊人的87%。这一突破性成果不仅大幅改善了性能表现,更在测试的215个 PyTorch 模块上实现了平均1.87倍的加速倍率,部分工作负载的速度甚至提升了数百倍。

研究人员精心挑选了来自Anthropic、DeepSeek和OpenAI等顶尖机构的八种AI模型,利用这些模型为苹果设备量身定制优化的GPU内核。这一创新过程无需修改用户代码或引入新框架,即可直接在苹果硬件上显著提升模型性能。实验中,研究团队采用搭载Apple M4Max芯片的Mac Studio作为测试平台,基准设置为PyTorch的eager模式。测试数据来自KernelBench数据集,涵盖215个PyTorch模块,内容从基础的矩阵乘法到复杂的完整模型架构,全面评估AI生成内核的性能。测试流程包括接收输入和PyTorch代码,自动生成Metal内核,并严格评估其正确性。数据显示,随着尝试次数的增加,AI生成内核的正确率逐步提升,第五次尝试时正确实现比例已达到94%。

令人惊喜的是,这些AI模型在生成内核时展现出跨层级的能力。尽管非推理模型有时也能生成有效内核,但实验结果表明,GPT-5模型在某些任务上实现了4.65倍的速度提升,而o3模型在某些情况下甚至将延迟降低了9000倍。研究还发现,单一模型并非万能,多个模型的组合能够生成更优的内核。为了进一步突破性能极限,研究者尝试引入额外上下文信息,如CUDA实现和gputrace的性能分析数据,结果显示这种方法在性能加速方面达到了平均1.87倍,比普通智能体的1.31倍提升了三倍。

AI自动生成Metal内核 PyTorch推理速度提升87%创纪录插图1

值得注意的是,研究人员强调,这项研究并非旨在追求最终的性能极限,而是验证AI在内核生成中的可行性,希望通过自动化流程减轻开发人员的负担。这一成果标志着AI技术在硬件优化领域迈出了重要一步,为未来更高效的计算性能打开了新的大门。

github:https://github.com/ScalingIntelligence/KernelBench/

划重点:
🌟 AI自动生成Metal内核,提升PyTorch推理速度87%。
⚡️在215个PyTorch模块上实现平均1.87倍的加速,部分工作负载速度提升数百倍。
🔍研究旨在验证AI在内核生成的可行性,助力硬件优化。

最新快讯

2026年03月05日

19:04
3月3日,开发商Weyrdworks宣布,桌面宠物模拟游戏《Weyrdlets: Idle Desktop Pets》将于3月17日正式转为付费模式。玩家可于3月17日前免费入库Steam。游戏自2024年7月上线,经持续更新已发展为完整养成作品。3月17日将同步推出2.0版本,重构经济系统,降低道具价格,并确保所有物品均可通过游戏内玩法获取。玩家将在小岛...
19:04
2026年3月5日,广汽丰田宣布在华新能源车型核心供应链已实现本土化。旗下新车铂智7将搭载华为鸿蒙座舱5.0、Momenta R6智能驾驶辅助系统及双腔空气悬架,售价定于20万元以内。此举旨在提升产品竞争力与交付效率,响应中国新能源汽车市场对智能化、高性价比车型的迫切需求。
19:04
2026年2月第二、三周,中国AI模型周调用量分别达4.12万亿和5.16万亿Token,连续两周超越美国同期水平。OpenRouter数据显示,Top5模型中四款来自中国厂商,贡献85.7%调用量。机构指出,AI运营成本中电力占比高达60%-70%,Token可视作‘电力衍生品’。随着国产大模型出海加速及算力需求激增,电力系统长期价值获重估契机。涪陵电力...
19:04
3月5日,*ST松发公告披露,其下属公司恒力造船(大连)有限公司与欧洲船东签订4艘30.6万吨超大型原油运输船(VLCC)建造合同,总金额约4至6亿美元。合同签署地为大连,签约方为恒力造船与 undisclosed European shipowner。该订单金额占公司2024年度经审计主营业务收入的50%以上,系重大经营合同。项目将按国际规范建造,交付期...
19:04
微新创想:北京时间2026年3月6日凌晨2点《杀戮尖塔2》将在Steam平台开启抢先体验 本作是Mega Crit开发的续作延续了前作的美术风格并在此基础上进行了全面升级 游戏新增了大量卡牌敌人事件与场景让玩家在探索过程中体验到更多新鲜内容 同时引入了替代章节以及5名可选角色其中包括2名全新角色为游戏增添了更多选择性 还特别加入了4人在线合作模式让玩家能够与...
19:04
微新创想:3月4日,广和通在西班牙巴塞罗那举行的2026年世界移动通信大会(MWC 2026)上宣布率先实现基于MediaTek T930与高通X85/X82平台的功率等级1(PC1)模组技术落地 此次技术突破标志着广和通在5G-A领域迈出了重要一步。通过双平台的协同应用,该模组能够全面支持3Tx/8Rx/L4S等关键技术 3Tx技术有效提升了上行吞吐量,最...
19:04
微新创想:2026年3月5日,哔哩哔哩(B站)在港交所发布2025年第四季度及全年财报。2025年全年净营业额达到303.5亿元,同比增长13%。这一成绩标志着公司在内容生态和用户增长方面取得了显著进展。 微新创想:净利润方面,公司实现了11.9亿元的盈利,与去年同期的亏损13.6亿元形成鲜明对比。经调整净利润为25.9亿元,进一步体现了公司经营状况的改善和...
19:04
微新创想:近日,爱立信联合中国移动在江苏永联村部署了5G-A网络及差异化连接方案。该方案通过引入先进的网络切片技术,实现了对全村无线资源的高效划分,并结合RedCap技术,确保了网络覆盖的全面性和稳定性。这一举措不仅为永联村带来了更优质的通信体验,也为当地数字治理、民生服务以及产业升级提供了强有力的技术支撑。 微新创想:5G-A网络的部署使得村内各类智能应用...
19:04
微新创想:2026年3月5日,香港养和医疗集团与中国人寿保险(海外)股份有限公司正式开启首次合作,标志着香港首家为“ENRICH•盈加”钻石级客户提供全流程健康管理及医疗礼宾服务的医疗机构诞生。此次合作不仅体现了双方在高端医疗服务领域的深度整合,也彰显了对高净值人群健康需求的高度重视。 合作内容涵盖全面的健康评估服务,为客户提供个性化的健康分析与建议。同时,...
18:30
微新创想:2026年3月5日,TÜV莱茵北美洲正式完成对咨询与培训机构Quality Support Group Inc.(QSG)的整合。此次整合在北美地区实施,由TÜV莱茵主导,旨在强化其在该区域的业务布局。 此次整合标志着TÜV莱茵在北美市场迈出了重要的一步。通过将QSG纳入旗下,TÜV莱茵不仅扩大了其服务网络,还增强了在专业领域内的技术实力和行业影响...
18:30
微新创想:2026年3月,爱立信在巴塞罗那举行的MWC世界移动通信大会期间,凭借“意图感知切片(ARRP)”技术荣获GTI年度大奖——移动技术创新突破奖。这项技术代表了5G网络智能化发展的重要一步,其核心在于实现无线资源的自动划分。ARRP通过先进的算法和智能分析,能够实时感知用户需求并动态调整网络资源分配。 微新创想:ARRP具备四大显著特性,包括动态频谱...
18:30
微新创想:3月5日,杭州瓴通智能科技有限公司在浙江杭州正式注册成立,注册资本为1000万元,法定代表人是林鸣晖。公司由阿里巴巴旗下的北京锐讯灵通科技有限公司全资持有,标志着阿里巴巴在智能科技与基础软件领域的布局进一步深化。此次成立的新公司专注于软件开发与销售,同时也涉及计算机软硬件及外围设备的制造业务。通过这一举措,阿里巴巴不仅增强了其在人工智能底层技术方面...