编者按:本文来自微信公众号 经纬创投(ID:matrixpartnerschina),作者:经纬创投主页君,微新创想经授权发布。近期,人形机器人领域掀起热潮。2023世界机器人大会在北京成功举办,现场人潮涌动。同时,宇树科技、智元机器人等创新企业纷纷发布自家的人形机器人产品,当这些能够站立行走、奔跑跳跃的机器人真实出现在公众面前时,引发了市场的强烈反响。机器人技术一直是理论探讨容易,科幻描绘常见,但实际研发极具挑战性。即便在众多工厂的流水线上,机器人依然难以适应复杂的作业环境。然而,自去年底特斯拉推出人形机器人Optimus(擎天柱)以来,人形机器人赛道逐渐升温。那么,是什么原因让人形机器人成为热点?当前是否已达到技术突破的临界点?与工业机器人这一成熟领域相比,人们对机器人的新期待在底层逻辑上存在哪些差异?首先,我们总结核心观点:人形机器人赛道的火热,关键在于智能泛化能力的显著提升,使得通用机器人成为可能。过去,机器人行业迭代缓慢,主要因为每学习一项新动作都需要重新编程,仅实现机械自动化。而如今智能泛化能力的突破,甚至可以通过语音控制让机器人实现新功能,这是从自动化到智能化的根本转变,极大增强了机器人的通用性。英国机器人公司Engineered Arts的人形机器人Ameca,在接入Stable Diffusion后,能够完成简笔画创作,如绘制猫咪形象。基于这一认知,我们可以进一步探讨:当机器人技术突破临界点,更智能的机器人将如何应用?机器人是否必须采用人形设计?训练数据的获取瓶颈如何突破?本文将深入探讨这些问题,但需注意人形机器人作为新兴赛道,许多问题尚无定论,欢迎读者在评论区交流讨论。人形机器人是一个具有广阔前景的赛道,能够带动众多细分领域的发展。以特斯拉机器人Optimus为代表的硬件全景图,展现了人形机器人的巨大潜力。当机器人技术达到突破临界点,更智能的机器人将如何应用?曾经,机器人领域迭代速度相对较慢,如今汽车工厂中已广泛应用工业机器人,并拥有数十年的应用历史,但这类机器人多为非通用智能机器人。其瓶颈在于,工业机器人等非通用智能机器人(通常只是机械臂)只能在特定场景执行特定任务,其动作和反应算法都是预设的,一旦遇到新情况或环境变化,若无预先编写的算法应对,就会立即表现出“智能不足”。如今,通用机器人的出现可能改变这一现状,极大扩展机器人的潜在应用场景。过去,工业机器人只能在流水线的单点执行任务,如拧螺丝或组装部件,但有了通用机器人,只需教会其安装逻辑和评估标准,不仅能拧螺丝,还能在螺丝用完后自行从仓库取用,或配备灵巧手处理更复杂的任务。此外,结合大语言模型(LLM),我们还可以实现语音控制,只需说出“请给我拿杯水”,系统将语音转换成代码,再转换成机器人的动作。这并非影视剧中才有的场景,而是正在发生的现实。今年谷歌发布Robotics Transformer-2(RT-2),微软发布“ChatGPT for Robotics”论文,为整个机器人行业带来巨大震动。这些新进展与过去“每做一套新动作就需要重新编程一次”的机器人相比,存在天壤之别。未来,无论是在工厂车间、商场还是家庭,都可能出现通用机器人,适应不同环节,无需重新编程即可在不同任务间灵活切换。目前,大多数通用机器人创业公司的首要目标并非ToC(消费者市场),而是ToB(商业或工业场景)。先在B端场景中打磨技术,再逐步应用于C端,是许多公司的战略规划。汽车生产是许多公司优先考虑的场景。汽车工厂规模庞大,自动化程度较高,许多环节已通过工业机器人实现流水线作业,但仍需大量人工操作。例如,在汽车工厂的总装车间,仍需大量人力,人形机器人可以替代这些环节,而非替代已实现自动化的部分。智元机器人的人形机器人应用在汽车工厂的案例。按照马斯克的计划,特斯拉首批机器人主要应用于B端,替代危险、枯燥、重复的工作,或人类不愿承担的任务。第二批大规模使用的机器人将具备现实世界导航能力,利用特斯拉电动车的视觉导航技术,无需特定指令即可执行有用任务;第三批则预计在10年后,人们可以在家中使用机器人。除了汽车工厂,3C产品的组装、检测等环节,以及商业场景中的零售业货架管理、清洁等,仍有大量人工需求。随着社会老龄化及人力成本上升,将出现巨大的劳动力缺口需要填补。当然,并非所有场景都必须采用人形机器人,应根据实际需求选择。宇树科技创始人兼CEO王兴兴曾表示,四足机器人相比双足机器人,具备更高的载荷能力、更强的平衡能力,且更易于控制、设计和维护,在工业端和消费端均有广泛应用场景,尤其适合在危险环境中替代人类作业。鸿海、软银投资的日本机器人初创公司Telexistence,可作为商超货架的补货机器人。然而,当前的通用机器人距离真正商业化落地仍面临诸多挑战。最明显的是成功率、执行速度和精度仍需提升。例如,谷歌的RT-2相比RT-1,执行成功率提升至80%,但在实机演示中仍出现错误,如将柠檬味苏打水误识别为“橘子味”,或回答“桌子上有什么水果”时说成“白色”而非实际存在的香蕉。谷歌解释称,因WiFi临时中断,机器人使用了缓存答案。虽然80%的准确率在一些场景可用,但在需要高精度的场景仍不足够。当然,我们探讨了具身智能和通用机器人,但并不意味着工业机器人领域没有机会,只是发展逻辑不同。在传统机械设备领域,仍有大量机器人零部件创新和国产替代的机会。例如,工业机器人的核心零部件减速器长期被日本和德国公司垄断,工业机器人整体国产化率仅为35%,尤其在汽车3C、焊接等细分赛道,国产化率偏低,结合智能化仍有成长空间和创新潜力。机器人是否必须采用人形设计?在无数科幻影视作品中,人形机器人一直是人类对机器人的终极想象,相比工业机器人,人形机器人代表着更高维的存在。但由于实现难度极大,长期以来并非机器人行业的主要形态,直到最近一年特斯拉推出人形机器人Optimus,才成为市场焦点。市场对此也存在诸多质疑:我们是否真的需要人形机器人?实现难度如此之大,何时才能在现实生活中落地?是否应先从机械狗、多轮底盘+机械臂等形态入手,而非直接追求人形?目前尚无确切答案。我们看到谷歌搭载RT-2的机器人,采用轮式底盘+单机械臂设计,已能实现捡拾小物、开窗户、垃圾筛选等功能。这种单臂、轮式服务机器人无需灵巧手或仿人腿的运动控制系统,也能满足许多家庭、工厂场景的需求。当然,其局限性在于无法上下楼梯。我们的观点是人形是终极形态,因为相信最终机器人将进入千家万户。但根据不同场景需求,其他形态的机器人也将共存,如不一定是双足双臂,更早出现的可能是轮式单臂。人形机器人的优势在于应用范围。从终局思维来看,人形机器人最适合社会所有场景,因为人类社会的建筑、工具等都是基于人类身形设计的,无需改变场景适应机器人,即可直接使用人类社会的所有工具。这也符合马斯克提出的愿景,即未来人类不想干的事都可以交给机器人,甚至发掘出目前尚未预料到的用途。例如,人类的腿和手在仿生步态下,机器人的运动能力远超传统履带、四轮、双轮机器人,可上下楼、跳跃过障碍物。对于手来说,基于空心杯电机的灵巧手可实现双手配合和工具替换,比传统工业机器人能使用更广泛的人类工具,技能更丰富。其次,从交互角度看,“人形”能传递丰富的肢体语言、面部表情等信息。心理学家梅拉宾法则强调肢体语言的作用,肢体语言最符合人类认知,人类无需重新学习即可轻松理解机器人的动作。结合大语言模型后,人机交互将更加流畅。例如英国Engineered Arts公司的人形机器人Ameca,输入大量真人表情数据,通过立体3D打印机制作出精确模具,实现了生动的面部表情和肢体语言。Ameca能在橡胶皮肤上表现出超过62种面部表情,这是其著名的“苏醒时刻”。尽管人形机器人优势明显,但最大的制约仍是软硬件技术的高难度。从每个关节的设计到运动控制、环境感知,每个环节都存在技术难题,综合起来对系统的集成度和鲁棒性要求极高。例如运动控制的标杆波士顿动力,成立31年,历经被谷歌、软银、现代集团收购,持续投入,虽实现了“跑酷”等炫酷功能,但背后是不计成本的投入、功耗极高、噪音很大,距离量产落地仍很遥远。不过,如果一家公司以人形机器人为目标,不代表其产品只有一款人形机器人。在攻克高难度技术过程中,无论是移动、抓取还是视觉感知等方面,都可以迭代出新的产品,最终将各项技术组合在一起。简单来说,人形机器人是最难的机器人形态,谁能做好人形,谁就能做好其他形态的机器人。总之,机器人的通用性和智能化是未来重点,但不一定非要是人形,当前仍需根据场景需求选择。训练数据是瓶颈,数据还能从哪里来?能否获取高质量且成本可控的数据,是当前制约智能机器人发展的关键,也是拉开公司间竞争差距的重要手段。前车之鉴是Everday Robots,曾是谷歌的明星独立项目,但在今年2月因成本控制被谷歌解散,并入其他部门。造成Everday Robots成本高昂的重要原因之一是数据采集成本过高。OpenAI也曾有机器人部门,但后来放弃,问题也出在数据收集上。为何采集成本如此之高?主要是因为Everday Robots基于真实环境采集数据。谷歌为训练PaLM-E,用了13台机器人,收集了17个月的数据,若在更复杂的工业场景,数据采集成本会更高。目前,人形机器人主流的数据获取手段有四种:遥操作数据:这是目前最主流的方式,特斯拉等机器人公司都在使用。这种方式基于人工遥操作,先学习人类动作,再对应到机器人。由于使用真实世界数据,数据质量最高,但采集成本也最高。机器人的遥操作模拟器数据:由于遥操作成本过高,基于模拟器生成仿真数据的方式越来越受欢迎。一方面,合成仿真数据可大幅扩展数据集,此外仿真场景还可补充现实中较少出现的任务。在导航、抓取物品等任务中,仿真表现不错,但在流体运动、物体破裂等对真实物理数据要求高的场景,仿真仍难以完全模拟。但模拟器并非万能,如何构建丰富的3D内容、设置合适的奖励机制等,也是其面临的问题,此外还有算力成本。视频数据:鉴于线上视频网站中存在大量第一人称视角视频,这些视频可让机器人或AI学习,都是真实人类活动的视频,通过图像训练机器人的行为决策,可快速低成本实现数据积累和泛化能力。目前学界和谷歌等大厂,都在尝试这种方式加速训练。模仿学习:这种方式仍在研究中,即让人直接在机器人面前演示一遍,机器人即可学会。例如在家庭场景中,扫地或把脏衣服放进洗衣机等动作,可能只需教几遍,无需额外采集数据,也不需要动作捕捉。已有不少相关论文发表。总之,具身大数据对机器人至关重要,缺乏具身数据很难训练出真正好用的具身基础模型。目前,每条数据获取的技术路径上,都有公司或高校在尝试,许多公司也混合使用多种方式,以最快速度和最低成本获取高质量数据。今年,机器人在真实环境中的规划、感知、决策、执行等能力大幅提升,通过语音直接控制成为可能,人机交互也显著增强。在这种智能化、通用性发展趋势下,通用机器人的应用领域被极大拓宽,人形机器人的商业化也成为可能。通用机器人还将推动工业制造能力飞跃,从只能机械完成代码指令的工业机器人,变成能使用大量人类工具、载具的通用机器人。而在工业制造领域,无论是在机器人零件端,还是工业制造的应用场景、训练所需的数据成本等方面,中国更具优势。英伟达创始人黄仁勋在ITF World 2023大会上表示,人工智能的下一个浪潮将是具身智能,即能理解、推理、并与物理世界互动的智能系统。而通用机器人,无疑是理想的载体。本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。
最新快讯
2025年11月15日
2025年11月15日,全球零售巨头沃尔玛正式宣布其首席执行官董明伦将于2026年2月1日卸任,开启职业生涯新篇章。根据公司官方公告,现任美国业务负责人约翰·弗纳将接棒董明伦,出任沃尔玛新一任首席执行官。这一重要人事调整不仅预示着沃尔玛管理层将迎来历史性变革,更彰显了公司对数字化转型战略的坚定决心。董明伦在公开声明中特别强调,弗纳凭借其在人工智能领域的深厚积...
近日,公安部发布了《机动车运行安全技术条件》的征求意见稿,其中针对新能源汽车提出了一项备受关注的新要求——"默认工作状态"。根据规定,乘用车在启动后应保持百公里加速时间不小于5秒的性能状态。这一条款迅速引发了社会各界的广泛讨论。在舆论关注下,起草工作组负责人及时进行了澄清,强调新规的核心目的并非限制车辆本身具备更强的加速能力,而是通过技术手段规范车辆启动瞬间...
科技媒体Tom's Hardware于11月15日独家报道,微软正式宣布将就英国竞争上诉法庭的一项关键裁决提起上诉。该裁决判定,用户拥有合法权利转售Windows和Office等软件的永久许可证,明确驳回了微软关于此类行为构成"版权侵权"的诉讼主张。这一里程碑式的判决不仅颠覆了微软长期以来的商业策略,也为全球软件行业带来了深远影响。
案件起因可追溯至2021...
诺基亚正式宣布一项重大战略调整,计划在2030年前逐步关闭其位于德国慕尼黑的核心研发基地,并同步裁撤超过700个研发岗位。这一决定标志着这家芬兰巨头在全球研发布局上的深刻变革,也引发了业界的广泛关注。据德国金属工业工会IG Metall最新披露的信息显示,裁员将采取分阶段实施策略,最早将于2026年在德国境内削减300多个职位,后续剩余岗位将根据公司战略需求...
微新创想11月15日重磅报道,知名影视制作团队影视飓风Tim的领军人物,在拥有1400万粉丝的互动问答视频直播中,收到了一个意想不到的粉丝建议——去相亲角体验一把。这一建议迅速引发了热议,Tim不仅欣然接受,还精心准备了一份简历,亲自前往相亲角参与活动。事实上,让粉丝指定内容并由影视飓风团队或Tim亲自实现的互动形式,一直是影视飓风粉丝问答视频中的传统环节。...
11月14日,微博热搜榜上演惊险一幕,#冷美人退赛#话题强势登顶榜首,迅速引爆全网关注。据权威媒体报道,湖南张家界七星山景区举办的荒野求生挑战赛中的热门选手"冷美人"杨朝芹,因体检不合格遗憾退出比赛。现场知情人士透露,幸好有热心路人及时扶住昏迷的她并送往医院,冷美人苏醒后第一句话竟是"这是哪?要去哪里",言语间透露出对比赛的不舍与遗憾,她反复说着"不甘心"和...
科技媒体Android Authority近日独家爆料,谷歌正在秘密研发一款代号“手势交换”的安卓新功能,旨在通过创新手势交互方式,让用户能够近距离便捷地交换联系人信息。这一功能在功能设计上与苹果的NameDrop高度相似,不仅支持照片、电话号码、电子邮箱等个人资料的分享,更贴心加入了“仅接收”的隐私模式,为用户数据安全提供双重保障。
据曝光的早期界面截图显...
2025年11月11日,极兔速递再创历史纪录,全球单日包裹处理量成功突破1亿件大关,较去年同期增长9%,彰显其强大的业务增长势头。这一里程碑式的成就,不仅得益于“双十一”和“黑色星期五”等全球性电商促销活动的强劲推动,更体现了极兔速递在旺季高峰期的卓越运营能力。
在11月1日至12日这一关键时期,极兔速递日均包裹量高达9,459万件,同比增长15%,进一步印...
零跑汽车近日传来振奋人心的消息,截至11月,其2025年度累计销量已突破50万台大关,不仅提前完成了原定全年销售目标,更展现了强劲的市场竞争力。值得注意的是,公司曾在8月份就已经展现出对市场的高度信心,将年度销量预期上调至58万至65万辆的区间,这一前瞻性的判断如今得到了充分验证。
今年上半年,零跑汽车交出了一份亮眼的成绩单,交付量达到22.17万台,同比增...
2025年11月15日,中国通号传来振奋人心的消息,成功中标青藏铁路无人机反制示范项目。这一重要成果标志着我国在铁路安防领域取得重大突破,为保障高原铁路安全运行提供了创新解决方案。该项目由中国通号下属的低空安全技术有限公司具体承建,将在青藏铁路沿线关键区段部署一套先进的铁路专用无人机智能防护系统。该系统是公司自主研发的核心产品,凝聚了多项尖端技术,将有效提升...
近日天猫发布的《2025天猫双11宠物消费观察报告》揭示了一个显著趋势——养宠人群正从传统的“基础喂养”模式升级为“精致养宠”新阶段。报告数据显示,过去三年间天猫平台宠物行业规模持续扩大,宠物食品成交额更呈现高速增长态势。这一变化背后,是消费观念的深刻变革。行业专家指出,随着人们生活水平的提高,科学化、精细化的喂养方式逐渐成为主流选择,不仅体现在宠物饮食上,...
微软近期对媒体创建工具(MCT)进行了重要更新,现已向用户开放下载集成了2025年11月关键安全补丁的Windows 11 25H2与24H2最新系统镜像。此次升级不仅包含了一系列常规的安全修复程序,更特别针对了此前被广泛用于非法系统激活的KMS漏洞进行了彻底封堵,显著提升了系统的安全防护能力。
值得注意的是,尽管系统镜像内容已全面更新,媒体创建工具本身的版...
