体重28kg,身高1.2m,加上双手,全身上下34个自由度

清华机器人戴学士帽走红网络 身高1.2米34自由度插图

编者按:本文来自微信公众号量子位(ID:QbitAI),作者:衡宇,微新创想经授权转载

清华机器人戴学士帽走红网络 身高1.2米34自由度插图1

这年头,人形机器人都有清华的学士帽戴!这位走出清华二校门的机器人,简直要把门口参加暑期研习营的小孩们馋哭了。不仅拥有清华紫学士帽,在刚刚结束的WAIC“具身通用人工智能”论坛上,这个名叫小星的人形机器人,还和图灵奖得主、中国科学院院士姚期智合影贴贴。是谁羡慕了?我不说。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图2

小星这“人”,出自清华大学交叉信息研究院(IIIS)陈建宇团队,整机结构、电机、减速器、驱动器、步态算法等机器人软硬件将通通自研。陈建宇,31岁的清华叉院助理教授,28岁时,就已经以叉院博导的身份走在从教之路上。博士毕业于UC伯克利,本科就读于清华大学精密仪器系,研究领域包括机器人学、强化学习、自动驾驶等。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图3

人形机器人小星

清华机器人戴学士帽走红网络 身高1.2米34自由度插图4

一起来认识一下,这位青年博导“教”出来的人形机器人——体重28kg,身高1.2m,加上双手后,全身上下具有34个自由度。在行走方面,小星在不同类型的地面上都可以稳步前进,比如落满枯叶的林间小道:或者是公园花坛旁的水泥上坡路:脚下的地皮换成草坪,也不妨碍它踏步前进:总之就走得还挺稳的,速度也还不错。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图5

与此同时,它还能利用双手提供一些服务功能,递个烧烤、端杯咖啡什么的:在液压驱动和电机驱动二者之间,小星采用了成本优势更高的后者。为了研发高性能、低成本的人形机器人,团队坚持最新一代的准直驱力控方案,用高扭矩密度电机搭配低减速比减速器,用电流环直接力控搭配动态双足行走算法。这种方案对电机扭矩要求极高,因此团队也一直在探究新的电机设计方案。目前所研制的电机扭矩密度已达到了30Nm/kg,是TQ电机(目前工业界最强)的两倍以上。如此一来,无论是行走还是摆臂动作,小星都能保持在一个比较灵活的状态。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图6

不过,陈建宇也坦然表示,目前小星机器人硬件上搭载的算法智能性还不够高,小星的现阶段表现,还没有发挥硬件可以支持的极限。因此,团队的另一项主要工作就是推进前沿的机器人智能算法,目前走的是动力学模型+优化控制和物理仿真+强化学习这两条机器人领域最前沿的路径。相比于传统的机器人算法,二者都更为通用,并且可以更多地利用动力学来提高性能。这两大方法也是陈建宇博士期间的主攻研究方向。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图7

2017年,陈建宇提出了一系列实时轨迹优化算法并成功应用于无人车上。从2018年起,陈建宇的研究重点转向了更为前瞻的方法——深度强化学习算法。在这一阶段,他做出了领域内较早的几个基于自学习方法的复杂道路环境自动驾驶工作。“从数学上来说,无人车也是一类机器人,我们研究的算法对于无人车和机器人来说都是通用的。” 陈建宇表示,在无人车时期关于强化学习的经验,不少都可以迁移到人形机器人的研究上,“当然,无人车和人形机器人的关注点不全相同,比如无人车在底层控制方面相对简单,而对上层的决策规划和交互等关注较多”。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图8

通过强化学习结合人体运动数据,小星在高精度物理仿真中学会了高度拟人的步态行走:还能挖掘出硬件的极限性能,达到4m/s的奔跑速度:除了灵活的双腿,小星的双手也很灵巧。通过大规模并行仿真强化学习训练,小星学会操控其二十多个自由度的双臂灵巧手来完成各类任务。此外,为了协调小星手脚之间的协同工作,团队还提出了一种分布式技能学习算法。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图9

“我想,人形机器人是所有机器人学家的梦想!”从本科起,陈建宇就开始关注双足步态算法,他的本科毕业设计,做的就是双足机器人落脚点规划。2020年毕业回国,在探索过无人车、机械臂、机器狗后,于2021年底开始构思筹划研发自己的人形机器人。筹备了半年,想通了技术路径,也就是去年春夏之交,陈建宇开启了自己的新目标:打造人形通用机器人,以及搭载在上面的“通用智能”。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图10

具身通用人工智能

清华机器人戴学士帽走红网络 身高1.2米34自由度插图11

目前人形机器人存在的技术难题是什么?陈建宇总结了最受关注的三个方面:首先,由于人形机器人具备高度集成性和复杂性,硬件本体构建具有较高挑战性;其次是运动小脑的构建,如何控制双腿行走和操控双臂完成各种任务,还未被很好解决;最后是人形机器人的“大脑”,如何将目前只有语言功能的大模型拓展到物理世界,并让其进行行为决策,是实现具身通用智能体至关重要的一环。——这就引出近期最火的技术话题之一,具身智能。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图12

5月的ITF World 2023半导体大会上,黄仁勋在演讲中明确表态,下一波AI浪潮就是具身智能(Embodied Intelligence)。所谓具身智能,就是能够理解、推理并与物理世界互动的智能系统,可以理解为有身体,并支持物理交互的AI智能体。而具身智能的终极目标,就是具身通用人工智能。以ChatGPT为代表的通用人工智能虽然带来了极大的轰动,但其只有语言与文本处理的能力。未来我们一定需要更加有用的具身的通用人工智能。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图13

7月WAIC的具身通用人工智能论坛,邀请了包括姚期智先生、Sergey Levine、Anca Dragan、Koushil Sreenath、Jiajun Wu等国内外知名大咖学者一起探讨具身AGI的未来,内容涵盖决策控制、感知认知、本体构建、算力支持、大模型理论等。小星也在论坛上进行了现场首秀,获得了大量关注。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图14

国际上,一些团队已在这个方向上有了初步的成果:今年年初,谷歌推出5620亿参数的多模态具身视觉语言模型PaLM-E,可以执行各种复杂的机器人指令而无需重新训练。哪怕受到干扰,也能完成“帮忙从抽屉里拿薯片”的指令。李飞飞团队也新近发布了具身智能最新成果,大模型接入机器人,把复杂指令转化成具体行动规划,无需额外数据和训练。人类可以很随意地用自然语言给机器人下达指令,如“打开上面的抽屉,小心花瓶!”

清华机器人戴学士帽走红网络 身高1.2米34自由度插图15

陈建宇团队也在推进这方面的研究工作。并且做出了世界上第一篇大模型结合人形机器人的学术工作。他们用大模型来指导小星的上层任务规划,用强化学习来获取小星的底层控制器。与此同时,还提出了一套新的框架来解决上层规划和下层执行之间的对齐问题,以确保下层控制能很好地执行上层规划的任务。“我们发现,一些简单的操作场景,接入13B的开源模型就比较够用了。”陈建宇分享了实验过程中的发现,“作为定位家庭服务的机器人,对数理逻辑、推演等功能的要求并不太高。”

清华机器人戴学士帽走红网络 身高1.2米34自由度插图16

紧接着,量子位又把“大模型幻觉在具身智能身上的解决思路”这个问题抛给了陈建宇。比起网络世界里的胡说八道,现实世界人形机器人受到带有幻觉的指令,似乎是一件更为严肃、需要正视的事情。思考片刻后,陈建宇给出了他的答案,那就是可能需要两手解决方案,一方面是大模型产品本身对幻觉的控制,另一方面,在底层的控制也要加强。之前我在研究无人车对安全性的要求时,会设计一些方案提升无人车的行为安全,具身智能也可以采取相同的思路,在机器人收到“不安全”的指令时,及时识别,更改到安全区域范围。所以,添加一个完全基于物理规律,类似于安全护盾的底层保护层,或许是不错的办法~

清华机器人戴学士帽走红网络 身高1.2米34自由度插图17

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

清华机器人戴学士帽走红网络 身高1.2米34自由度插图18

最新快讯

2026年02月10日

08:49
微新创想:2026年2月9日,微软面向Windows Insider Beta与Dev频道用户发布KB5077201和KB5077202更新,版本号分别升至Build 26220.7755与Build 26300.7760。此次更新不仅带来了多项功能改进,还为用户提供了更丰富的使用体验。 更新引入了Emoji 16.0标准的7个新表情,包括‘眼袋脸’‘指纹’...
08:49
微新创想:微软近日已通过弹窗通知用户,将于2026年10月13日起停止对Microsoft Publisher的支持。这一决定意味着该工具将从Microsoft 365订阅服务中移除,用户在届时将无法打开或编辑以.pub为扩展名的文件。对于依赖Publisher进行文档排版的用户而言,这一变化将带来显著影响。 微软还指出Office LTSC永久授权版自20...
08:49
微新创想:2026年2月10日,多家上市银行在信贷“开门红”中加大地方重点产业贷款投放力度。这一举措体现了银行在新的一年里对区域经济发展的高度重视与积极响应。 截至2月9日,13家上市银行累计接受了54次机构调研,涉及机构总数达到386家。调研数据显示,银行正逐步调整信贷策略,紧密结合区域发展战略,明确对公信贷的主攻方向。 在具体实施过程中,银行将重点支持沿...
08:49
微新创想:2026年1月中旬至2月10日,148家券商累计调研了超过560家A股上市公司,与去年同期相比增长了约26%。这一数据反映出市场对上市公司基本面的关注度持续上升,尤其是在经济复苏预期和政策支持背景下,投资者对优质企业的挖掘更加积极。 调研重点主要集中在电子、机械设备、医药生物等成长性较强的行业。这些行业不仅具备较高的技术壁垒,还受益于产业升级和消费...
08:36
微新创想:近日 关于是否应对人工智能(AI)使用礼貌性用语 特别是“谢谢”一词 引发了社会各界的广泛讨论 随着AI技术的不断进步 一个看似微小却引人深思的问题浮出水面 对AI说“谢谢” 是否会造成不必要的资源浪费 一段时间以来 网络上流传着一种观点 认为对AI表达感谢会触发其计算模块的额外运算 从而浪费算力与电力 这一说法虽未经严格证实 却引起了公众的广泛关...
08:18
微新创想:2026年2月10日 长安汽车与宁德时代联合发布全球钠电战略 2026年2月10日 长安汽车与宁德时代联合发布全球钠电战略 此次合作标志着双方在新能源汽车领域的深入探索与技术突破。双方共同推出搭载宁德时代“钠新”电池的首款钠电池量产乘用车并在重庆正式亮相 这是钠电池技术首次在乘用车领域实现规模化应用 长安汽车旗下多品牌将陆续搭载该电池 随着钠电池技...
08:18
微新创想:2026年2月10日,国际科研团队成功研发一种细长柔韧、内置微通道的柔性脑植入物。该装置可在活体大脑中精准输送药物至特定脑区,适用于癫痫、记忆与决策机制等研究。其柔性设计降低组织损伤风险,提升长期植入安全性。研究旨在推动神经系统疾病如帕金森病、阿尔茨海默病的靶向治疗。相关成果发表于《先进科学》期刊。
08:18
微新创想:2026年2月10日,新加坡、法国和美国联合科研团队在《自然·光子学》发表成果,研制出基于拓扑光子学的片上紧凑型天线。该天线集成于芯片微结构中,可高效辐射与接收太赫兹波,显著提升信息处理密度与无线数据传输速率。研究旨在支撑6G通信系统发展,为高频段通信提供关键器件基础。
08:18
微新创想:2026年2月10日,受AI算力需求激增影响,片式多层陶瓷电容器(MLCC)价格启动上涨。韩国现货价已涨近20%,短期涨势延续。三星电机、风华高科、三环集团等龙头企业股价同步上扬。 业内分析指出,2026年MLCC市场将加速分化:AI服务器等应用带动高端MLCC需求爆发,而中低端产品面临需求疲软与成本上升双重压力。随着人工智能、物联网等技术的快速发...
08:18
微新创想:2026年2月10日,广西壮族自治区自然资源厅宣布将统筹安排自治区财政资金2.6亿元用于找矿工作。这一投入规模较2025年翻倍,显示出政府对矿产资源勘探工作的高度重视。 此次找矿工作重点聚焦于南丹关键金属高质量发展综合试验区的整装勘查。该试验区作为广西矿产资源开发的重要区域,将得到更加系统和深入的地质调查与资源评估。 同时,重点区域的关键金属矿产勘...
07:48
微新创想:2026年2月,谷歌母公司Alphabet计划发行总额200亿美元的债券,这一数额远超此前预期的50亿美元。此次债券发行的期限最长可达2066年,其利率与美国国债相比利差收窄至0.95个百分点。这一融资举措将主要用于支持公司今年高达1850亿美元的资本开支,其中重点投入人工智能领域所需的数据中心建设。 科技行业正处于快速发展的关键阶段,各大科技巨头...
07:48
微新创想:2026年2月9日,苹果公司与中国人民大学联合推出新型AI模型VSSFlow。该模型可在单一系统内,从无声视频中同步生成高保真环境音效与人类语音。这一突破性技术为视频内容创作提供了全新的可能性,使用户无需额外音频素材即可实现沉浸式音效体验。 微新创想:VSSFlow采用了10层架构与流匹配技术,通过联合训练实现语音与音效生成的协同增益。这种设计不仅...