高通与Meta近日联合宣布一项重大合作,计划从2024年起将Meta全新的大型语言模型Llama 2成功部署于高通芯片驱动的手机及PC平台。这一突破性进展标志着大型语言模型应用场景的重大革新,有望彻底改变人工智能技术的落地方式与成本结构。
长期以来,大型语言模型主要依托大型服务器机房运行,以英伟达GPU为核心计算单元。这种模式虽然满足了模型对算力的巨大需求,但也导致了英伟达股价今年飙升超过220%的异常表现。相比之下,高通等移动芯片制造商在人工智能浪潮中获益有限,股价今年仅上涨约10%,明显落后于纳斯达克指数36%的涨幅。此次合作正是高通抢占AI边缘计算市场的重要战略举措,旨在将自身处理器打造为AI应用的理想”边缘设备”而非传统”云端”方案。
据专家分析,若大型语言模型能够从云端数据中心迁移至手机等终端设备运行,将显著降低AI应用的开发与运营成本,同时提升语音助手等应用的响应速度与用户体验。高通将为其设备提供Meta开源的Llama 2模型支持,这将有力推动智能虚拟助手等创新应用的开发进程。Meta的Llama 2模型具有两大核心优势:首先,其可执行ChatGPT类多项功能,但采用更优化的程序打包方案,完全适配移动端硬件环境;其次,高通芯片内置专为AI计算设计的”张量处理器单元”,虽与数据中心顶级GPU存在性能差距,但足以支撑基础AI应用需求。
Meta此次最大胆的举措是公开Llama 2模型的”权重”数据集——这一组指导AI模型运行的核心数字参数。通过开放权重数据,研究人员和企业可自由在本地设备上部署该模型,无需支付任何许可费用。这一做法与OpenAI的GPT-4、Google的Bard等封闭式大型语言模型形成鲜明对比,后者严格保密权重数据。值得注意的是,高通与Meta此前已建立深度合作关系,特别是在其QuestVR设备芯片开发方面。此前高通已成功在其芯片上运行Stable Diffusion等开源AI模型,此次Llama 2的部署将进一步提升高通在AI领域的竞争力。