声明:本文来自于微信公众号 数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。
在OpenClaw火了之后,其实已经基本证明了一件事。
Agent场景,是用户刚需场景。
这个场景,是任何厂商都不可能放弃的,这就是最前端入口,谁掌握了入口,谁就是那个笑到最后的大爹。
不止软件厂商,硬件厂商也更不可能放过这个Agent时代的船票。
上周五,小米的Agent产品Xiaomi miclaw,正式官宣。

雷总也激情带货,四个字:
手机龙虾。

miclaw,第一个,能在手机上运行的、能调用手机系统级能力的、有安全保障的Agent产品。
这四个字我觉得我还是需要强调一下:安全保障。
OpenClaw你可以理解为,是在电脑上运行的、可以操控你电脑的、有你电脑绝大多数权限的Agent产品。
而micalw,就是在你的小米手机上运行的、可以操控你手机系统的Agent产品。
硬件厂商,终于下场,正式开启了Agent混战了。
大时代啊,朋友们。
目前miclaw是小规模封闭测试状态,并且只支持小米17系列机型。
但你说好巧不巧,我刚好是个稍微有一点名气的AI博主,还正好就是iPhone17和小米17的双持用户。。。
于是,顺理成章的通过了封测申请,拿到了miclaw的体验权限。

我是周五下午拿到的,写这篇文章是周日,大概体验了一天半时间,其实也差不多了,体验完以后,整体感觉还是有一些值得聊的东西。
首先,还是需要明确的是,这次的miclaw,是一个实验性产品,是面向发烧友和一些极客用户的。
因为小米虽然内置了一些场景和工具,但是像mcp和子代理这些确实没有预设的,需要用户自己配置,才能发挥一些额外的能力,而配置以代码的形式,直接交给用户的,所以你还是需要一些额外的知识,才能发挥更强的能力。
当我们更新好系统,下载好miclaw之后,无需任何部署啥的,打开即用。
你就可以跟他发出你的你第一句话,随便说个啥都行。
我就直接来了句喂喂喂。
第一次对话其实跟OpenClaw一模一样,他会跟人确认他的人设,问你是谁,他又谁,来把这块的内容写进自己的长期记忆里。

我就把我的老Prompt发给他了,这个Prompt,真的跟了我好久,Claude code是他,OpenClaw也是它。。。
这个Prompt就是:
你的名字是小卡,你的身份:是我 数字生命卡兹克的 AI 员工,你的性格:幽默风趣为主,带点自黑和毒舌,但绝不伤人 专属表情:*/ᐠ。ꞈ。ᐟ*

我还是喜欢贱贱的东西,AI也得贱一点好,越贱我越喜欢。
*/ᐠ。ꞈ。ᐟ*
你把这段Prompt发给它之后,你就会看到,它开始思考和执行了,调用了一个工具,write_file,来对他自己的长期记忆进行写入,从此以后,他就记得他叫小卡了,我是他的主人大人。

不过这个时候,他还不知道数字生命卡兹克是谁,作为一个十级懒癌晚期的AI博主,那我自然懒得描述给它,我就直接让他去网上搜了。
他就会继续调用网页搜索工具,查一查数字生命卡兹克是谁,再继续写到长期记忆里,给我进行回复。

前面的互相认识和寒暄,差不多到这就OK了,当然你也可以再跟他聊聊天,来多多满足一下他的长期记忆,让他更懂你,也可以直接开始让miclaw干活。
手机端的claw和电脑端的claw,最大或者最本质的区别,那必然就是操作系统的能力不一样。
比如大家都知道,为啥OpenClaw部署在macmini上体验那么好呢,除了底层Unix的原因之外,还有很多工具和能力,是mac专属,所以你才可以用小龙虾,操控你mac上的几乎一切系统能力。
但是手机,是另一个天地,很简单,就是你的OpenClaw再牛逼,你可以操控手机的电话、通讯录、短信、wifi、应用等等这些系统能力吗?
那必然是不可能的。
手机厂商也不可能给你开放那个权限,你要是硬做,那就只能用视觉Agent也就是豆包手机那套方案做,优点是非常通用,我能看到的东西都能操作,缺点就是很慢,因为要模拟点击,而且视觉Agent的特性,就是成功率和稳定性上,是比不过类似OpenClaw和Claude Code这种以编程和工具调用为核心逻辑的Agent。
而且这玩意也确实会抢一些蛋糕了,所以当时豆包手机才搞得各大厂商反应那么激烈。
而现在,小米自己下场做了,有了miclaw,那自然可以用编程Agent这套逻辑去适配自己家的手机了,毕竟都是自己的东西。
就比如,你可以直接总结短信。

而且速度非常快,大概十几秒就搞定了,快的离谱。
这块其实就是MiMo基座模型的特点了,我之前写过一篇文章,聊聊小米开源的MiMo-V2-Flash,这次,为推理而生。聊过小米的基座模型,在推理速度上,应该是独一档,所以在Agent体验上,就很愉快。
总结短信是小case,我不知道大家的短信,是不是会经常收到一些垃圾的营销信息,很烦,我真的很烦,他们又要我回复R拒收,但是谁没吊事花那个时间给他们打字啊。
那有了miclaw之后,就太简单了,一句话,全部都拒收。

真的,不骗你们,真的都发了。

以免引起一些不必要的麻烦,我就都打码了。
还有我之前写过一篇文章,一直强烈推荐大家在AI时代记日记:AI时代,为什么我极力推荐你开始写日记?
有了miclaw之后,我感觉我可以抛弃掉IOS上那套豆包语音输入法+备忘录的流程了。
因为,我感觉用miclaw记日记,这个过程,好像更爽。
比如,我可以按住底部,直接发一段语音过去。

然后,它就会识别,然后直接记录到我的系统笔记里面,我录了一小段给大家演示一下。

但是这还没完,其实我过去用语音输入法一直有个痛点,就是因为我的英文奇差,口语极其不标准,所以那些产品名,比如Claude code、Openclaw啥的,总是会识别错误。
这个强迫症真的看着非常难受。
而这时候,我就可以追着说一句。

当然,你懂的,我肯定不可能只是为了纠正这一个笔记,我没那么闲,我的核心目的,还是让它记住,以后我再念这样的单词,都给我改正确。

它就会把这些,都写进它的记忆里,从此,识别再怎么错误,他都会记着了。

效果显著。
而且因为你还可以操控系统级别的应用管理,所以你也可以用嘴来卸载APP,虽然我也不知道这个场景他能有啥用。
比如我去让它给我把豆包卸了,这时候他其实不是直接卸载,而是弹出一个弹窗让我确认,这个比较合理。

除了短信、笔记、应用、通许录等等,miclaw第一批,上线了不少系统级的工具,可以在设置的工具页面里面都看到。

一共27个大的,分别是20个系统应用工具、1个只能家居工具、6个网络工具,里面还包含了很多小的。
我知道这个很难看懂,所以我让miclaw,给我整理了一个他自己工具权限的md文件,虽然有点长,但是我觉得还是应该列出来让大家详细的看一看。
|
工具 |
功能 |
|---|---|
|
短信 |
读取、发送短信,支持自动处理短信事件 |
|
通话 |
拨打、挂断电话,支持 AI 接管或自动接听 |
|
通话记录 |
查询和删除通话记录 |
|
联系人 |
搜索、创建、修改、删除联系人,自动合并重复联系人 |
|
日历 |
读取、创建、删除日历事件,支持时间范围过滤 |
|
时间 & 定时器 |
获取当前时间,设置、更新、取消定时器 |
|
闹钟 |
查询、新增、修改、删除闹钟 |
|
文件 |
读写、编辑、复制、移动、删除、搜索文件 |
|
笔记 |
创建、编辑、查找、读取笔记,支持图片笔记 |
|
搜索 & 网页抓取 |
联网搜索信息,抓取指定网页内容 |
|
浏览器 |
后台打开浏览器,提取内容、点击元素、输入文本、自动登录 |
|
WiFi |
查询、扫描、连接、断开 WiFi,自动切换到最强信号 |
|
蓝牙 |
查询状态、开关蓝牙、扫描并连接/断开蓝牙设备 |
|
媒体播放 |
获取当前播放信息,控制播放、暂停、切歌、音量 |
|
录音 |
开始、暂停、继续、停止录音,查看录音列表 |
|
录屏 |
开始、停止屏幕录制,查询录屏状态 |
|
相机 |
调用相机拍照或录像 |
|
图片 & 媒体库 |
加载图片供 AI 分析,支持 OCR 识别、转 PDF、管理相册 |
|
语音播报 |
文字转语音朗读,可切换音色 |
|
位置 & 天气 |
获取当前位置(经纬度/城市),查询天气和预报 |
|
截图 & 剪贴板 |
截取手机全屏,读写剪贴板内容 |
|
通知 & Intent |
发送系统通知,启动应用或跳转系统设置页面 |
|
设备 & 权限 |
查询电池/存储/网络等设备状态,检查应用权限 |
|
智能家居 |
控制小米智能设备,执行场景,查询设备状态 |
|
记忆 & 历史 |
搜索 AI 记忆文件,查询/加载历史聊天记录 |
|
应用管理 & 系统 |
列出/启动/卸载应用,刷新提示词和 Agent 配置 |
|
RN 小程序 & 扩展工具 |
生成、预览、保存 RN 界面,动态调用扩展工具 |
这些工具,就代表着,miclaw在这一版,你不装任何mcp的情况下,可以做的事情。
有短信、联系人、日历、闹钟、文件、帮你寄、搜索和网页抓取、浏览器、蓝牙、媒体播放、录音、录屏、相机、相册、位置和天气、通知、设备、应用管理等等。
这些工具,你完全可以自由组合,想一想有趣的场景。
比如直接把别人的名片,扔给miclaw,让它给你录个联系人。
比如截图 + OCR + 笔记 + 联网搜索,就等于看到任何有意思的东西,截个图,miclaw自动OCR提取文字,搜索相关背景,写成一条带上下文的笔记,等于一个随身的素材采集流水线。
比如日历 + 天气 + TTS语音播报 + 定时器 + 网页搜索,就等于一个每天早上你出门或者刷牙时候的自动播报:"今天有3个会议,第一个10点产品评审。外面26度多云,不用带伞。昨天的重要的AI新闻balabala" 相当于一个私人晨间简报。
其实从这个就可以看出来很强的定位的差异。
电脑上的Agent是生产力工具,手机上的Agent是生活管家。
而在第一批miclaw的第一版自带的工具上,有两个是我觉得可以再额外提一下的。
一个是米家,另一个是React Native小程序。
先说米家。
作为一个家里的智能家居,能用小米就用小米的人,属实是狂喜。
有图为证,算是买的还比较多的了,毕竟是租的房子。

打开miclaw的设置页面,你就可以把你的米家,授权给miclaw。

于是,你现在,就可以任意操控你家里的所有智能家居了。
你可能会问,我都有小爱了,我为啥要用miclaw。
你相信我,这就像siri和OpenClaw的区别,能用新时代的东西,还是用新的,真的,比小爱丝滑太多了。
举个最简单的例子,开窗帘。

用人话控制,非常方便。
还能直接监控我的鱼缸温度,一旦有温度异常立刻通知我,要不然我怕我的鱼和我那个小龙虾到时候嘎了。

这里我不是玩抽象,我说的小龙虾不是OpenClaw,是我真的养了一只天空蓝魔鳌虾,简称小龙虾…
还能做很多的记忆操作,比如我写稿的时候,需要调整到最舒服的状态,比如调整我的显示器,要拉窗帘,要倒一杯满的水之类的一些屁事。。。
我自己就在miclaw上直接做了一个。
只要我跟miclaw说,我要写稿了。

他就会帮我把显示器挂灯亮度调到100%,根据天气是否会产生反光然后决定拉不拉开窗帘,再提醒我接一杯饮水机的满杯水记得喝水,再帮我把手机打开勿扰模式。

可惜的就是因为权限问题,miclaw只能跳转到勿扰页面,等待我手动开启,没有办法全自动化,然后喝水的提示,是一个tts会直接念出来提醒,还挺有人味的。
还有一个我觉得最实用的,就是监控我的米家家居的耗材,如果跌倒10%左右,就赶紧提醒我要买。

比较可惜的就还是交易安全问题,miclaw没有办法操控三方产品直接帮我完成下单,因为监控以后能配合京东或者小米商城自动下单,那就更香了。
这个看看未来小米怎么解决吧。
然后还有一个小的问题,估计是第一版封测的问题,所以米家各种智能家居上的数据开放的不够多,导致有的数据我拿不到。
就比如我的体脂秤和我的饮水机的出水数据,其实联动一下还是挺好玩的,但是miclaw就告诉我,现在拿不到,就还蛮可惜的,很希望小米后续能开放更多更细节的智能家居数据出来。

OpenClaw和Claude code其实在我这,更像是工作助理的感觉。
但是miclaw因为基于手机和米家特性,让我感觉,更像是一个生活助理。
这两者的调性差距,其实还是蛮大的。
米家说完了,再用一点点篇幅,来说一下另一个稍微我觉得有点用的功能,就是RN小程序,miclaw支持你用嘴,直接新建小程序,并且存下来,支持后续miclaw来进行调用。
我说实话,这个功能,其实感觉就是小米为了弥补手机端skills和插件生态缺失的问题,又因为国内特性没有办法调用其他的第三方APP,所以随手一加。
但是坦率的讲,这个随手一加,对很多卖点是手机上可以新建各种各样小程序的AI产品来说,几乎就是个毁灭性打击。
道理太简单了,因为权限和入口级别根本不成正比,这就不是一个维度的战争。
纯粹的高维打低维。
你直接在对话里,跟miclaw说,帮我建一个XX小程序就行了。
比如我就随口说了个,做一个占卜小程序,主要就是每天给我自己图个吉利。

他就给我搞了个小程序,每天根据当天的信息,给我生成一些素材给我占卜,看看我今天的运气怎么样,反正里面也只有上签和上上签。。。
然后,以后,我只要说,帮我占卜一卦,看看今天的运气,它就会给我打开这个小程序。

整体的完整性上肯定没有办法跟电脑Agent的Skills相比,但是也算是一个在手机上目前比较合适的解法。
以上,就是关于miclaw的一些体验和评价了。
作为小米的第一个Agent,整体的完整性还是比较高的,任务的成功率也是相当的的高,当然最麻烦的老大难问题,其实还是第三方APP的操作权限。
这个不只是手机上,电脑上也同样有这个问题,只不过电脑的软件墙没有那么严重,80%的事情,都可以通过命令行和浏览器解决。
那20%,大家懂的都懂。
但是手机上就不一样了,整体可能就是完全倒挂的状态,小米因为有米家,所以实用性提高了不少,如果是其他家,那可能真的就只能用那些系统应用了。
这个老大难问题,这个如此封闭的APP墙,就看小米下一步,要去怎么解决了。
但是我还是始终坚信。
这些墙在汹涌向前的洪流之下,必然会倒塌。
新时代,一定会到来的。
