iPhone 17 Pro本地运行4000亿参数大模型挑战算力极限

微新创想:智能手机的算力极限在哪里
苹果的最新旗舰iPhone17Pro刚刚给出了一个既令人震撼又略显尴尬的答案
3月23日,拥有 4000亿参数 的大语言模型在iPhone17Pro上成功跑通
要知道,即便经过量化压缩,此类模型通常也需要至少200GB 的内存才能运行
而iPhone17Pro的硬件配置仅为12GB LPDDR5X 内存

技术“黑科技”: 闪存流转与混合专家模型
在内存容量严重不足的情况下,这次“不可能的任务”主要依靠两个技术路径实现
SSD 强行“扩容”: 借助 Flash-MoE 开源项目,设备直接从固态硬盘(SSD)向 GPU 流式传输数据
突破了物理内存的上限
MoE 架构优势: “MoE”代表混合专家模型(Mixture of Experts)
这意味着系统在生成每个单词时,只需要调用4000亿参数中的一小部分
而非全量负载

速度硬伤
每两秒蹦出一个词虽然“跑通了”
但实际体验距离“可用”还有巨大的鸿沟
实测显示
生成速度: 仅为 0.6Token/秒
换句话说,大约每1.5到2秒才能生成一个单词
功耗压力: 这种高强度的本地运算会极速消耗手机的电池寿命
发热情况也不容小觑

行业启示
本地大模型的“奇点”将至
尽管目前的生成速度让人“抓狂”
但这次演示的象征意义远大于实用价值
它证明了在手机端本地运行顶级规模大模型并非死路一条

隐私护城河
本地运行意味着数据无需上传云端
能够提供极高的隐私保护

离线可行性
在无网络环境下获取顶级 AI 的回复正在成为可能

正如业内评价
“能跑起来”和“能流畅使用”是两码事
但随着算法优化与硬件迭代
当0.6token 进化到60token 时
智能手机将真正进化为随身携带的“超级大脑”

最新快讯

2026年03月24日

13:21
微新创想:2026年3月24日,韩国SK海力士宣布启动美国ADR发行承销商遴选工作,预计融资规模达10~15万亿韩元,约合458~687亿元人民币。这一举措标志着公司在全球资本市场上的进一步扩张,同时也为后续的融资计划奠定了基础。 同日,SK海力士确认将以11.95万亿韩元,约合547.31亿元人民币的价格,向ASML韩国采购TWINSCAN EXE:520...
13:21
微新创想:2026年3月,北京安泉数智科技有限公司宣布完成新一轮数千万元融资,由元起资本独家投资。此次融资标志着公司在数据安全与人工智能系统安全领域的发展迈上新台阶。 公司专注于数据安全与人工智能系统安全领域,致力于为客户提供AI赋能的网络数据安全及AI自身安全产品与服务。通过融合人工智能技术,安泉数智科技不断推动安全技术的创新与应用,满足日益增长的安全需求...
12:48
微新创想:谷歌近日宣布正在积极开发iOS版Chrome浏览器的更新版本。根据科技媒体MacObserver的报道,此次更新将引入一项实验性Flag(kPageActionMenuAuthFlow),主要目的是优化页面操作菜单(PAM)的徽章可见性与整体稳定性。同时,该更新还将支持“询问Gemini”功能的身份验证流程,使得用户在使用AI助手时更加便捷和安全。...
12:48
微新创想:2026年3月24日,工信部在国新办新闻发布会上宣布启动工业数据筑基行动。该行动旨在开展高质量行业数据集建设先行先试,由信息技术发展司牵头推进。 微新创想:重点包括加强跨部门资源保障,确保工业数据工作的顺利开展。同时,出台数据要素赋能新型工业化政策文件,为行业发展提供制度支持。 微新创想:印发工业场景应用指引,帮助企业和机构更好地理解和应用工业数据...
12:48
微新创想:3月24日,水利部等六部门联合印发通知,部署加强农村供水工程运行管护工作。通知明确稳步推进农村供水价格改革,坚持公益属性与民生保障前提,统筹供水成本、农民承受力及财政补助等因素开展成本监审。这一举措将有助于更科学地制定水价,确保农村供水系统的长期稳定运行。 实行居民与非居民用水分类定价,城乡一体化工程执行统一水价。通过这种分类方式,可以更合理地分配...
12:48
微新创想:3月23日,AMD通过GPUOpen平台向全球开发者发布FSR SDK 2.2。该版本适配Adrenalin Edition 26.3.1驱动,新增对超分辨率4.1与光线再生1.1功能的支持。 微新创想:超分辨率4.1优化了动态场景下的推理算法,显著提升画质清晰度,并增强超性能模式及动态分辨率缩放(DRS)性能。这一改进使得游戏在不同分辨率下都能保...
12:48
微新创想:2026年3月24日,国产电子设计服务商嘉立创宣布其云端三维CAD软件全面开启公测。该软件为原生Web应用,无需安装,支持Windows、macOS及Linux系统,注册后即可免费使用。 产品覆盖草图设计、特征建模、装配设计与工程图生成等全流程功能,并集成自主研发的建模引擎、约束求解器与渲染引擎。用户可实时协同、自动云端存档,并在设计阶段进行可制造...
12:48
微新创想:2026年3月24日,国际评级机构惠誉发布基准情景预测。根据当前市场分析,预计布伦特原油价格将在3月底前保持稳定,维持在现有水平。随后,油价将逐步回落,全年平均价格预计为每桶70美元。 微新创想:惠誉的预测建立在多项关键因素之上,包括全球供需平衡的改善、非OPEC+产国的增产趋势以及全球能源需求增速的放缓。这些因素共同作用,使得市场对原油价格的走势...
12:17
微新创想:抖音平台近期加大了对未成年人网络环境的治理力度。根据其最新公布的治理进展,从3月10日至3月23日的两周内,平台共清理了涉及未成年人的违规内容10.2万条,同时处置了4114个违规账号。这些违规行为主要包括不当涨粉、诱导消费以及传播不良信息等。 为有效遏制不良内容的扩散,抖音采取了多层次的处置措施。平台不仅对违规内容进行了全面清理,还对相关账号实施...
12:17
微新创想:2026年3月24日,英特尔未发布的Wildcat Lake系列处理器——酷睿5 320与酷睿3 310,已出现在BAPCo CrossMark及Geekbench数据库中。这表明英特尔正在加速推进其新一代处理器的开发计划。该系列处理器采用了2P+4LP-E核心设计,即2个性能核与4个低功耗核的组合,以兼顾性能与能效。这种架构设计使得处理器能够在保...
12:17
微新创想:3月22日,彭博社报道称,苹果硬件主管约翰·特努斯是iPadOS诞生的核心推动者。早期iPad沿用iOS,被视作“大号iPhone”,难以发挥其大屏与强处理器优势。特努斯洞察此局限,力主开发专属系统,并协同软件团队促成2019年iPadOS发布。 新系统强化多任务与桌面级交互,同时他主导推出Apple Pencil、妙控键盘及磁吸配件生态。这些创新...
12:17
微新创想:2026年3月,德国建筑机器人研发商KEWAZO宣布完成新一轮融资。本轮融资由Schooner Capital领投,Chevron Technology Ventures、Asahi Kasei等多家机构首次参投,老股东True Ventures与Cybernetix Ventures持续加注。KEWAZO专注于建筑数字化,为工地提供智能机器人及施...