ChatGPT引领的大模型浪潮在软件应用领域势不可挡,但与硬件设备的融合却显得步履维艰。率先打破僵局的是微软的竞争对手谷歌。今年5月,谷歌发布了新一代大语言模型PaLM 2,代号”壁虎”的版本每秒可处理约20个Tokens(相当于16个单词),特别适用于手机等移动设备,支持离线使用。更值得关注的是,通过与谷歌搜索、地图、邮件、视频等产品的联动,这些功能将得到全面重构。大模型向手机端渗透的战火骤然升温。6月29日,荣耀在上海世界移动通信大会上宣布,未来将把AI大模型引入端侧设备。7月初,搭载高通第二代骁龙8芯片的安卓手机直接运行了参数规模超过10亿的Stable Diffusion模型,只需15秒即可生成图像。这一突破性进展完全基于本地计算,无需依赖云端资源。8月初的华为开发者大会上,随着HarmonyOS 4的发布,基于AI大模型的全新技术让华为智能语音助手小艺迎来三大方向升级。在华为的设想中,盘古大模型赋予小艺的能力将彻底摆脱传统语音助手的呆板形象,变得更加智能、高效和贴心。但冷静分析,由ChatGPT引发的技术热潮是否只是昙花一现?各大厂商纷纷将大模型接入智能手机,究竟是营销噱头还是真正创新?
01″人工智障”的华丽转身
移动端智能语音助手在过去很长一段时间里被戏称为”人工智障”。这种刻板印象源于影视作品中的AI助手形象,如《钢铁侠》中的贾维斯,与苹果的Siri、小米的小爱、华为的小艺等现实产品形成巨大反差。许多用户都有过这样的经历:对语音助手下达指令时,最常见的回应是”我不太明白”,甚至完全无响应,不得不反复尝试。在大模型的赋能下,华为宣称小艺将变得更聪明、更实用、更贴心,在设备操控、语音交互、文案创作等方面游刃有余,能够理解复杂场景对话并作出恰当反应。
这背后是华为在大模型领域的长期布局。7月7日华为开发者大会上,华为常务董事、华为云CEO张平安正式推出盘古大模型3.0,构建了通用大模型、行业大模型和场景模型的”三级架构”,为行业提供全方位大模型服务。最新迭代的HarmonyOS 4深度融合了盘古大模型底层能力,为C端用户带来更智能、高效、个性化的AI体验。例如智慧助手小艺不仅支持语音交互,还扩展了文字、文档、图片等多模态交互方式,用户可以用更自然、模糊的口语化表达与小艺交流。
小艺背后的大模型是在盘古L0基座模型基础上,针对终端消费场景构建的场景数据和精调L1对话模型。根据官方发布会和体验视频,华为小艺在处理复杂任务时表现出色,如设置闹钟、播报新闻、识别文字生成表格等。但受限于HarmonyOS尚未正式发布,小艺目前仅处于测试阶段,计划于8月底开放邀请测试,后续通过OTA升级在部分搭载HarmonyOS 4.0机型上体验。从技术蓝图到实际落地,再到融入普通用户生活,仍需时日。
02参数、算力与能耗的平衡之道
大模型的参数规模巨大,训练时对算力的需求成为关键瓶颈。中国工程院院士高文将算力比作电力,指出没有强大算力就无法构建真正的大模型。华为轮值董事长胡厚崑也强调,大模型训练效率和创新速度根本上取决于算力水平。因此,研发ChatGPT的OpenAI对英伟达A100/H100芯片的需求激增,订单额超数十亿美元,导致H100芯片出现43万张缺口。
当大模型嵌入手机后,算力保障和芯片性能成为新的挑战。荣耀CEO赵明曾表达对端侧大模型能耗的担忧:后台持续运行的AI需要解决低功耗问题。未来端侧大模型时代,必须平衡”更智能的AI”与”更优的续航”之间的关系。由于大模型规模越大,所需存储空间和计算能耗也越高,目前行业主要通过知识蒸馏、轻量化架构、剪枝、量化等技术手段压缩模型,将其”塞”进手机。最终能耗表现仍需实验室测试验证。
数据参数是另一个关键问题。华为终端BG首席运营官何刚透露,小艺月活用户超2亿,智慧屏小艺日均唤醒7次以上;小米小爱同学月活达1.15亿,累计语音交互2158亿次,控制79类智能产品。但要让大模型达到千亿级参数量级,这些语音助手的数据量仍显不足。
03噱头还是真创新?
小米新品发布会上,雷军宣布将全面拥抱大模型,小爱同学将率先升级。与此同时,OPPO、vivo也在积极布局大模型领域。据国外媒体报道,苹果已开始招聘大模型研发人才,其巴黎AI研究所从Meta挖角相关专家。智能手机能否在大模型加持下突破存量市场瓶颈?
一方面,云端AI算法在手机端应用存在三大短板:响应延迟高、个性化不足、云端压力大。这既影响用户体验,又增加厂商云服务器成本。而智能手机作为每年出货量达十几亿的移动计算单元,其闲置算力若能得到有效利用,将实现厂商与用户的双赢。
另一方面,智能手机厂商在激烈同质化竞争中急需新技术突破。语音助手作为用户智能化入口,在理解个性化需求方面具有独特优势。但这一发展方向也面临争议,如训练数据合法性等问题。华为明确表示,将坚持安全与隐私保护原则,主张负责任的AI发展。
尽管AI大模型发展迅速,但将其彻底引爆端侧仍需时日。这一技术潜力恰好契合智能手机厂商的期待,但真正实现大规模落地,还需要时间检验。