
随着“一句话搞定”从营销口号逐渐变为现实体验,智能手机终于迈入了真正理解人类意图的新纪元。中兴通讯近期推出的Nebula-GUI小模型,正将AI智能体深度融入手机操作系统之中,让努比亚Z70Ultra、Z80Ultra等旗舰机型摇身一变成为“随身私人助理”。用户无需打开任何App,只需通过语音指令,例如“帮我订一张明天下午去上海的高铁票”或“用美食模式拍一张这张蛋糕的照片”,手机便能自动跨应用完成全流程操作。这一革命性能力的背后,是中兴在离线端侧AI智能体领域的重大突破。
最新评测显示,仅70亿参数的Nebula-GUI在权威离线手机GUI Agent测试中斩获银牌,综合得分高达84.38。特别是在自动订票、点餐等高复杂度任务中,其操作速度与准确率显著优于同类方案。更关键的是,Nebula-GUI无需联网,所有推理均在设备端完成,既兼顾了响应速度,又保护了用户隐私。目前,该模型已覆盖30余款主流App,包括12306、美团、高德、微信、支付宝等,常用场景的平均任务完成准确率超过90%。用户不再需要手动切换应用、填写表单或点击层层菜单,复杂的操作被压缩为一次自然语言交互。
突破中文GUI数据瓶颈,自建端到端训练体系实现这一体验的最大挑战,在于高质量中文图形用户界面(GUI)数据的极度稀缺。为此,中兴自研了一套端到端数据制备系统,从自动化截图采集、语义标注到合成指令生成,构建起覆盖数千种操作路径的训练闭环。该系统显著提升了数据标注效率与一致性,同时大幅降低制作成本,为模型训练提供了坚实的基础。

在此之上,团队通过监督微调(SFT)技术,将通用多模态大模型转化为具备“感知-理解-执行”闭环能力的GUI智能体。它不仅能识别屏幕元素,还能理解用户意图、规划操作路径、调用系统权限,并在执行中动态纠错,确保现实场景下的鲁棒性。
从实验室走向商用,定义下一代手机交互Nebula-GUI的商用落地,标志着手机AI助手正从“语音问答”迈向“主动执行”新阶段。中兴透露,下一步将扩展至购物比价、旅游规划、跨App信息提取等更复杂场景,进一步强化“手机小秘”的实用性。在端侧AI成为行业共识的今天,中兴凭借Nebula-GUI证明:真正的智能不在云端,而在用户指尖。当手机不仅能听懂你说话,还能替你动手,人机交互的边界,正在被重新书写。
