编者按:本文来自微信公众号 经纬创投(ID:matrixpartnerschina),作者:经纬创投主页君,微新创想经授权发布。近期,人形机器人领域掀起热潮。2023世界机器人大会在北京成功举办,现场人潮涌动。同时,宇树科技、智元机器人等创新企业纷纷发布自家的人形机器人产品,当这些能够站立行走、奔跑跳跃的机器人真实出现在公众面前时,引发了市场的强烈反响。机器人技术一直是理论探讨容易,科幻描绘常见,但实际研发极具挑战性。即便在众多工厂的流水线上,机器人依然难以适应复杂的作业环境。然而,自去年底特斯拉推出人形机器人Optimus(擎天柱)以来,人形机器人赛道逐渐升温。那么,是什么原因让人形机器人成为热点?当前是否已达到技术突破的临界点?与工业机器人这一成熟领域相比,人们对机器人的新期待在底层逻辑上存在哪些差异?首先,我们总结核心观点:人形机器人赛道的火热,关键在于智能泛化能力的显著提升,使得通用机器人成为可能。过去,机器人行业迭代缓慢,主要因为每学习一项新动作都需要重新编程,仅实现机械自动化。而如今智能泛化能力的突破,甚至可以通过语音控制让机器人实现新功能,这是从自动化到智能化的根本转变,极大增强了机器人的通用性。英国机器人公司Engineered Arts的人形机器人Ameca,在接入Stable Diffusion后,能够完成简笔画创作,如绘制猫咪形象。基于这一认知,我们可以进一步探讨:当机器人技术突破临界点,更智能的机器人将如何应用?机器人是否必须采用人形设计?训练数据的获取瓶颈如何突破?本文将深入探讨这些问题,但需注意人形机器人作为新兴赛道,许多问题尚无定论,欢迎读者在评论区交流讨论。人形机器人是一个具有广阔前景的赛道,能够带动众多细分领域的发展。以特斯拉机器人Optimus为代表的硬件全景图,展现了人形机器人的巨大潜力。当机器人技术达到突破临界点,更智能的机器人将如何应用?曾经,机器人领域迭代速度相对较慢,如今汽车工厂中已广泛应用工业机器人,并拥有数十年的应用历史,但这类机器人多为非通用智能机器人。其瓶颈在于,工业机器人等非通用智能机器人(通常只是机械臂)只能在特定场景执行特定任务,其动作和反应算法都是预设的,一旦遇到新情况或环境变化,若无预先编写的算法应对,就会立即表现出“智能不足”。如今,通用机器人的出现可能改变这一现状,极大扩展机器人的潜在应用场景。过去,工业机器人只能在流水线的单点执行任务,如拧螺丝或组装部件,但有了通用机器人,只需教会其安装逻辑和评估标准,不仅能拧螺丝,还能在螺丝用完后自行从仓库取用,或配备灵巧手处理更复杂的任务。此外,结合大语言模型(LLM),我们还可以实现语音控制,只需说出“请给我拿杯水”,系统将语音转换成代码,再转换成机器人的动作。这并非影视剧中才有的场景,而是正在发生的现实。今年谷歌发布Robotics Transformer-2(RT-2),微软发布“ChatGPT for Robotics”论文,为整个机器人行业带来巨大震动。这些新进展与过去“每做一套新动作就需要重新编程一次”的机器人相比,存在天壤之别。未来,无论是在工厂车间、商场还是家庭,都可能出现通用机器人,适应不同环节,无需重新编程即可在不同任务间灵活切换。目前,大多数通用机器人创业公司的首要目标并非ToC(消费者市场),而是ToB(商业或工业场景)。先在B端场景中打磨技术,再逐步应用于C端,是许多公司的战略规划。汽车生产是许多公司优先考虑的场景。汽车工厂规模庞大,自动化程度较高,许多环节已通过工业机器人实现流水线作业,但仍需大量人工操作。例如,在汽车工厂的总装车间,仍需大量人力,人形机器人可以替代这些环节,而非替代已实现自动化的部分。智元机器人的人形机器人应用在汽车工厂的案例。按照马斯克的计划,特斯拉首批机器人主要应用于B端,替代危险、枯燥、重复的工作,或人类不愿承担的任务。第二批大规模使用的机器人将具备现实世界导航能力,利用特斯拉电动车的视觉导航技术,无需特定指令即可执行有用任务;第三批则预计在10年后,人们可以在家中使用机器人。除了汽车工厂,3C产品的组装、检测等环节,以及商业场景中的零售业货架管理、清洁等,仍有大量人工需求。随着社会老龄化及人力成本上升,将出现巨大的劳动力缺口需要填补。当然,并非所有场景都必须采用人形机器人,应根据实际需求选择。宇树科技创始人兼CEO王兴兴曾表示,四足机器人相比双足机器人,具备更高的载荷能力、更强的平衡能力,且更易于控制、设计和维护,在工业端和消费端均有广泛应用场景,尤其适合在危险环境中替代人类作业。鸿海、软银投资的日本机器人初创公司Telexistence,可作为商超货架的补货机器人。然而,当前的通用机器人距离真正商业化落地仍面临诸多挑战。最明显的是成功率、执行速度和精度仍需提升。例如,谷歌的RT-2相比RT-1,执行成功率提升至80%,但在实机演示中仍出现错误,如将柠檬味苏打水误识别为“橘子味”,或回答“桌子上有什么水果”时说成“白色”而非实际存在的香蕉。谷歌解释称,因WiFi临时中断,机器人使用了缓存答案。虽然80%的准确率在一些场景可用,但在需要高精度的场景仍不足够。当然,我们探讨了具身智能和通用机器人,但并不意味着工业机器人领域没有机会,只是发展逻辑不同。在传统机械设备领域,仍有大量机器人零部件创新和国产替代的机会。例如,工业机器人的核心零部件减速器长期被日本和德国公司垄断,工业机器人整体国产化率仅为35%,尤其在汽车3C、焊接等细分赛道,国产化率偏低,结合智能化仍有成长空间和创新潜力。机器人是否必须采用人形设计?在无数科幻影视作品中,人形机器人一直是人类对机器人的终极想象,相比工业机器人,人形机器人代表着更高维的存在。但由于实现难度极大,长期以来并非机器人行业的主要形态,直到最近一年特斯拉推出人形机器人Optimus,才成为市场焦点。市场对此也存在诸多质疑:我们是否真的需要人形机器人?实现难度如此之大,何时才能在现实生活中落地?是否应先从机械狗、多轮底盘+机械臂等形态入手,而非直接追求人形?目前尚无确切答案。我们看到谷歌搭载RT-2的机器人,采用轮式底盘+单机械臂设计,已能实现捡拾小物、开窗户、垃圾筛选等功能。这种单臂、轮式服务机器人无需灵巧手或仿人腿的运动控制系统,也能满足许多家庭、工厂场景的需求。当然,其局限性在于无法上下楼梯。我们的观点是人形是终极形态,因为相信最终机器人将进入千家万户。但根据不同场景需求,其他形态的机器人也将共存,如不一定是双足双臂,更早出现的可能是轮式单臂。人形机器人的优势在于应用范围。从终局思维来看,人形机器人最适合社会所有场景,因为人类社会的建筑、工具等都是基于人类身形设计的,无需改变场景适应机器人,即可直接使用人类社会的所有工具。这也符合马斯克提出的愿景,即未来人类不想干的事都可以交给机器人,甚至发掘出目前尚未预料到的用途。例如,人类的腿和手在仿生步态下,机器人的运动能力远超传统履带、四轮、双轮机器人,可上下楼、跳跃过障碍物。对于手来说,基于空心杯电机的灵巧手可实现双手配合和工具替换,比传统工业机器人能使用更广泛的人类工具,技能更丰富。其次,从交互角度看,“人形”能传递丰富的肢体语言、面部表情等信息。心理学家梅拉宾法则强调肢体语言的作用,肢体语言最符合人类认知,人类无需重新学习即可轻松理解机器人的动作。结合大语言模型后,人机交互将更加流畅。例如英国Engineered Arts公司的人形机器人Ameca,输入大量真人表情数据,通过立体3D打印机制作出精确模具,实现了生动的面部表情和肢体语言。Ameca能在橡胶皮肤上表现出超过62种面部表情,这是其著名的“苏醒时刻”。尽管人形机器人优势明显,但最大的制约仍是软硬件技术的高难度。从每个关节的设计到运动控制、环境感知,每个环节都存在技术难题,综合起来对系统的集成度和鲁棒性要求极高。例如运动控制的标杆波士顿动力,成立31年,历经被谷歌、软银、现代集团收购,持续投入,虽实现了“跑酷”等炫酷功能,但背后是不计成本的投入、功耗极高、噪音很大,距离量产落地仍很遥远。不过,如果一家公司以人形机器人为目标,不代表其产品只有一款人形机器人。在攻克高难度技术过程中,无论是移动、抓取还是视觉感知等方面,都可以迭代出新的产品,最终将各项技术组合在一起。简单来说,人形机器人是最难的机器人形态,谁能做好人形,谁就能做好其他形态的机器人。总之,机器人的通用性和智能化是未来重点,但不一定非要是人形,当前仍需根据场景需求选择。训练数据是瓶颈,数据还能从哪里来?能否获取高质量且成本可控的数据,是当前制约智能机器人发展的关键,也是拉开公司间竞争差距的重要手段。前车之鉴是Everday Robots,曾是谷歌的明星独立项目,但在今年2月因成本控制被谷歌解散,并入其他部门。造成Everday Robots成本高昂的重要原因之一是数据采集成本过高。OpenAI也曾有机器人部门,但后来放弃,问题也出在数据收集上。为何采集成本如此之高?主要是因为Everday Robots基于真实环境采集数据。谷歌为训练PaLM-E,用了13台机器人,收集了17个月的数据,若在更复杂的工业场景,数据采集成本会更高。目前,人形机器人主流的数据获取手段有四种:遥操作数据:这是目前最主流的方式,特斯拉等机器人公司都在使用。这种方式基于人工遥操作,先学习人类动作,再对应到机器人。由于使用真实世界数据,数据质量最高,但采集成本也最高。机器人的遥操作模拟器数据:由于遥操作成本过高,基于模拟器生成仿真数据的方式越来越受欢迎。一方面,合成仿真数据可大幅扩展数据集,此外仿真场景还可补充现实中较少出现的任务。在导航、抓取物品等任务中,仿真表现不错,但在流体运动、物体破裂等对真实物理数据要求高的场景,仿真仍难以完全模拟。但模拟器并非万能,如何构建丰富的3D内容、设置合适的奖励机制等,也是其面临的问题,此外还有算力成本。视频数据:鉴于线上视频网站中存在大量第一人称视角视频,这些视频可让机器人或AI学习,都是真实人类活动的视频,通过图像训练机器人的行为决策,可快速低成本实现数据积累和泛化能力。目前学界和谷歌等大厂,都在尝试这种方式加速训练。模仿学习:这种方式仍在研究中,即让人直接在机器人面前演示一遍,机器人即可学会。例如在家庭场景中,扫地或把脏衣服放进洗衣机等动作,可能只需教几遍,无需额外采集数据,也不需要动作捕捉。已有不少相关论文发表。总之,具身大数据对机器人至关重要,缺乏具身数据很难训练出真正好用的具身基础模型。目前,每条数据获取的技术路径上,都有公司或高校在尝试,许多公司也混合使用多种方式,以最快速度和最低成本获取高质量数据。今年,机器人在真实环境中的规划、感知、决策、执行等能力大幅提升,通过语音直接控制成为可能,人机交互也显著增强。在这种智能化、通用性发展趋势下,通用机器人的应用领域被极大拓宽,人形机器人的商业化也成为可能。通用机器人还将推动工业制造能力飞跃,从只能机械完成代码指令的工业机器人,变成能使用大量人类工具、载具的通用机器人。而在工业制造领域,无论是在机器人零件端,还是工业制造的应用场景、训练所需的数据成本等方面,中国更具优势。英伟达创始人黄仁勋在ITF World 2023大会上表示,人工智能的下一个浪潮将是具身智能,即能理解、推理、并与物理世界互动的智能系统。而通用机器人,无疑是理想的载体。本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。
最新快讯
2025年11月15日
2025年11月15日,江苏省正式宣布对汽车焕新促消费补贴政策进行重大调整,将最高补贴额度提升至1万元,旨在进一步刺激汽车消费市场活力。此次政策优化不仅惠及广大消费者,更体现了地方政府对扩大内需、促进经济增长的高度重视。补贴政策覆盖范围明确,凡是在2025年9月5日之后提交申请的消费者,均有机会享受此次升级后的补贴红利。
根据最新政策规定,补贴活动将持续整个...
2025年11月15日,中国重汽通过官方互动平台发布重要运营信息,透露公司当前订单储备充足,为后续生产运营奠定了坚实基础。企业正依据订单结构特点,科学规划生产节奏,通过优化排产流程,确保每一辆重卡都能按照客户要求的时限精准交付。这一举措不仅体现了中国重汽强大的市场竞争力,更彰显了其在生产管理方面的精细化水平。公司表示,通过提升生产效率与优化客户服务体验,将进...
Similarweb最新发布的权威报告揭示了一个令人瞩目的趋势:ChatGPT在生成式AI领域的绝对统治力正遭遇前所未有的挑战。过去一年间,其网络流量市场份额经历了显著下滑,从高达86.6%的巅峰水平骤降至72.3%,这一幅度超过14个百分点的差距凸显了竞争格局的剧烈变动。作为对比,曾经仅占5.6%市场份额的谷歌Gemini却实现了爆发式增长,其份额强势攀升...
科技媒体Android Authority最新消息,谷歌正计划在即将推出的Android 17系统中,推出一项革命性的原生"联系人选择器"功能,旨在彻底解决当前通讯录权限管理中存在的严重隐私隐患。目前,安卓系统采用的"全有或全无"权限模式,让用户在授权应用访问通讯录时陷入两难境地——要么完全开放个人联系人数据,要么彻底拒绝。这种粗放式的权限管理方式,无形中加...
2025年11月15日,美团在沈阳隆重发布《2026洗浴指南》,这份权威指南精选了全国28座城市的174家特色洗浴中心,为消费者提供全方位的洗浴体验参考。数据显示,2025年以来全国洗浴服务订单量呈现强劲增长态势,同比增长率超过30%,跨区域消费占比更是高达三成以上,显示出洗浴消费的全国化趋势日益明显。特别是在节假日,异地用户的消费需求激增,环比增长甚至翻倍...
《使命召唤:黑色行动7》自正式发售以来,其独特的全程强制联网设计迅速成为玩家热议的焦点。据权威科技媒体Notebook Check最新报道,这一设定不仅改变了传统单机游戏的体验,更引发了诸多争议。游戏中,玩家无法暂停单人战役模式,这意味着即使暂时离席处理事务,游戏也会持续运行。一旦遭遇敌人攻击,玩家可能面临进度丢失的窘境,这种设计无疑给注重沉浸感的玩家带来了...
2025年全球黑色星期五购物盛宴即将拉开帷幕,活动时间定于11月20日至12月2日,为全球消费者带来前所未有的购物狂欢。作为跨境电商巨头,亚马逊海外购将呈现空前的盛况,超过3万个国际知名品牌、300万款精选商品将悉数登场,覆盖服饰、家电、美妆、家居等35个以上丰富品类,更有超过1万个品牌同步推出全新产品系列,满足不同消费者的多元化需求。
活动预热阶段颇具看点...
近日,中国通号传来振奋人心的消息,成功中标备受瞩目的青藏铁路无人机反制示范项目。这一重要成果标志着我国在铁路安防领域取得了突破性进展,为保障高原铁路安全运行提供了创新解决方案。该项目由通号低空公司全权负责实施,将全面部署其自主研发的铁路专用无人机智能防护系统。该系统集成了无线电侦测、AI光电跟踪和多点协同反制三大核心技术,实现了对铁路沿线远、中、近距离无人机...
2025年11月15日,川发龙蟒在一场重要的机构调研活动中,就近期备受关注的硫磺价格上涨问题作出了详细回应。今年以来,硫磺价格呈现明显上行趋势,这主要得益于国际国内需求的双重增长以及供应链环节的持续偏紧。其中,新能源行业的蓬勃发展对硫磺需求的激增,成为了推动价格上涨的关键因素之一。
面对成本波动带来的挑战,川发龙蟒展现出其独特的应对策略。公司充分发挥“硫-磷...
2025年11月15日,备受瞩目的第十五届全运会迎来历史性突破——首个跨境马拉松赛事在粤港澳三地盛大启航。这场融合了广州、深圳与香港三地精华的马拉松盛宴,全程约42.195公里,不仅创下区域体育合作新纪录,更吸引了全国各地的顶尖跑者竞相角逐。在男子组决赛中,中国选手何杰凭借惊人的耐力与速度,以2小时09分30秒的优异表现率先冲过终点线,成功摘得桂冠。
何...
2025年11月14日,中国工商银行董事长廖林在北京与中国长安汽车董事长朱华荣举行重要会晤,双方就深化全面战略合作展开深入工作会谈。此次会晤聚焦于加强银企合作,推动金融服务与汽车产业的深度融合与创新发展,为中国汽车产业的转型升级注入新动能。
本次会谈由中国工商银行与中国长安汽车的主要负责人共同参与,体现了双方对合作的高度重视。会上,双方就未来合作方向与机...
游戏媒体Insider Gaming最新爆料称,备受全球玩家翘首以盼的《半衰期3》(代号HLX)有望在2026年3月正式发售,更有消息称这款传奇FPS巨作将作为Steam主机的首发游戏同步登陆新平台。据爆料人Tom Henderson在知名播客节目中的独家透露,《半衰期3》将与Valve即将推出的新一代硬件产品同步发布,为玩家带来次世代级的游戏体验。与此同时...
