编者按:本文来自微信公众号 阿尔法工场研究院(ID:alpworks),作者:举大名耳,微新创想经授权转载。时值八月,持续火爆半年之久的AI赛道已然显露降温迹象。然而就在行业热度回落之际,由被誉为华为天才少年的稚晖君倾力打造的人形AI机器人——「远征A1」横空出世,凭借一系列卓越特性,为略显沉寂的AI领域注入强劲活力。舞台中央,这个以小碎步优雅登场的机器人,瞬间吸引了全行业目光。这款由智元机器人(Agibot)推出的具身智能机器人之所以引发如此轰动,关键在于其搭载了最新的AI大模型技术。稚晖君在发布会上展示的内容显示,远征A1不仅能够胜任家务劳动、实验样本制备,甚至还能承担看护老人等需要高度情感交互的工作。那么,这个看似功能全面的AI机器人,究竟是如何在不同环境中灵活应对各类复杂任务的?其所代表的AI+具身机器人赛道,是否预示着AI发展的未来方向?抑或只是如同元宇宙般,成为一个难以落地的概念化产品?
在探讨人形机器人的未来之前,必须明确一个核心问题:人类为何总是倾向于设计成人形机器人?稚晖君给出了答案:”从第一性原理出发,人形双足机器人是人类环境中最为通用的终极形态!”换言之,要让机器人真正融入人类生活,就必须适应为人体量身打造的各类场景、设备和任务。例如,若要机器人操作精密仪器或灵活抓握物体,就必须具备与人类相似的手部结构;若要在城市环境中自由行走,就必须拥有能够弯曲的膝盖。而要实现这种灵活性和协调性,就必须在机器人硬件设计上进行一系列创新。智元机器人的谐波一体关节技术,正是其独特之处。作为机器人的传动装置,这种关节能够有效降低转速、增大扭矩,堪称机器人的”关节”。通常情况下,机器人的结构和关节数量决定了其自由度,即机器人能够独立控制的运动变量个数。自由度越高,机器人的运动越灵活,越能适应复杂环境。远征A1的自由度超过49个,手部拥有12个主动自由度,虽不及马斯克”擎天柱”机器人(全身200余自由度)的规模,但在六个月内取得这样的成就已属不易。
除了自由度,衡量人形机器人的另一重要指标是关节控制扭矩。控制扭矩决定了机器人的运动力量,相当于人类的肌肉力量。远征A1采用一体化自研的矢量控制驱动器,整体控制扭矩轻松超过350Nm。这一性能得益于智元机器人自主研发的PowerFlow关节电机。该电机创新性地采用液冷循环散热系统,通过液体传导将电机内部热量散发至外部散热器,有效降低温度和阻抗,提升效率与稳定性。同时,PowerFlow关节电机还采用了径向磁通外转子电机方案,使磁场能量更集中,绕组和铁芯散热效果更佳。此外,远征A1在核心部件上的创新还包括指尖传感器末端的视觉闭环、基于强化学习的运控算法等,这些技术共同赋予了其卓越的运动能力。
然而,要超越传统机器人,仅有灵巧的身躯远远不够。在AI技术飞速发展的今天,一个具备高度智能的”大脑”已成为具身机器人的关键组成部分。传统机器人主要依靠预先编程和固定规则工作,适用于重复性、确定性和简单性的任务,如工业生产线上的装配、搬运等。在大模型技术出现之前,传统机器人在执行复杂任务时存在明显局限:缺乏自适应能力,需要频繁重新编程才能适应新环境。例如,要让传统机器人从盒子里取出物体,必须事先告知其盒子和物体的位置、形状、大小、重量等信息。而大模型与机器人技术的结合,彻底打破了这些限制。具备强大语义理解、逻辑推理和图像识别能力的超大参数大模型,不仅能编排整个任务,还能动态调整。例如,让机器人将桌上垃圾扔进垃圾桶,无需明确告知垃圾种类和垃圾桶位置,所有知识都源自预训练GPT模型。凭借庞大的先验知识库和通识理解能力,机器人就能将原有能力泛化到更通用的场景中。
稚晖君认为,大模型对机器人最重要的价值在于复杂语义多级推理能力,即”思维链”。以让机器人做煎蛋为例,它需要通过思维链理解煎蛋的定义和制作方法(原料、工具、步骤),分析当前环境(厨房布局、物品位置),规划最优路径,最终完成打蛋、下锅等操作。这种能力使机器人能够通过简单指令执行复杂任务,这是传统机器人迈向通用机器人的关键突破。正因如此,远征A1不仅能在汽车产线从事传统工作,还能实现面向C端的陪护和照看功能,如烹饪、照顾老人、辅导孩子功课等。
那么,在具备更灵活的运动能力和更强泛化性后,具身机器人的市场前景如何?从各大科技巨头的布局中可见端倪:2022年8月,特斯拉发布全尺寸仿生人形机器人Optimus;同月,小米发布全尺寸人形机器人CyberOne;今年6月,腾讯发布旗下机器人工作室Robotics X研发的四足机器人Max的升级版;近期华为成立”极目机器”布局机器人与智能制造,注册资本8.7亿。种种迹象表明,众多科技巨头正看好仿生机器人领域,行业正处于高速发展阶段。
人形AI机器人的兴起,并非仅因大模型热潮,而是科技发展的内在规律。正如个人终端从台式电脑到笔记本电脑再到手机的演进,每一代终端都意味着将更多功能集成到统一平台。时至今日,手机已成为终极形态,集购物、视频、社交、学习等功能于一身。而人形AI机器人填补了所有平台都无法弥补的空缺——与真实物理世界的互动能力。因此,巨头们推出机器人产品更多是基于前期布局,而非简单跟风。
在这场新的产业竞争格局中,各参与者的潜力和竞争态势如何?科技媒体量子位从量产和资本能力两方面对行业玩家进行分析,绘制了清晰的象限图:第一象限为有强劲资本支持的明星企业(如腾讯、小米、大疆),它们拥有雄厚资金、技术和量产能力,可在无量产压力情况下不计成本研发原型机;第二象限为有潜力的小型公司(如大象机器人、钢铁侠科技),通常具有高校背景且产品专注特定领域;第三象限为产品未量产但获资本高度信任的企业(如智元科技)。国内机器人企业已覆盖从高端到低端、从2B到2C的完整生态链。在大模型赋能下,可预见机器人将在2C服务领域向多元化方向发展。
清华大学交叉信息研究院教授陈建宇曾说:”人形机器人将是下一代终端。具身智能机器人的出现才会是真正的’iPhone’时刻。”在国内机器人百花齐放的生态下,具身机器人发展如同自然进化,当参与者数量足够多时,突破性进展终将显现。本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。