编者按:本文来自微信公众号 经纬创投(ID:matrixpartnerschina),作者:经纬创投主页君,微新创想经授权发布。近期,人形机器人领域掀起热潮。2023世界机器人大会在北京成功举办,现场人潮涌动。同时,宇树科技、智元机器人等创新企业纷纷发布自家的人形机器人产品,当这些能够站立行走、奔跑跳跃的机器人真实出现在公众面前时,引发了市场的强烈反响。机器人技术一直是理论探讨容易,科幻描绘常见,但实际研发极具挑战性。即便在众多工厂的流水线上,机器人依然难以适应复杂的作业环境。然而,自去年底特斯拉推出人形机器人Optimus(擎天柱)以来,人形机器人赛道逐渐升温。那么,是什么原因让人形机器人成为热点?当前是否已达到技术突破的临界点?与工业机器人这一成熟领域相比,人们对机器人的新期待在底层逻辑上存在哪些差异?首先,我们总结核心观点:人形机器人赛道的火热,关键在于智能泛化能力的显著提升,使得通用机器人成为可能。过去,机器人行业迭代缓慢,主要因为每学习一项新动作都需要重新编程,仅实现机械自动化。而如今智能泛化能力的突破,甚至可以通过语音控制让机器人实现新功能,这是从自动化到智能化的根本转变,极大增强了机器人的通用性。英国机器人公司Engineered Arts的人形机器人Ameca,在接入Stable Diffusion后,能够完成简笔画创作,如绘制猫咪形象。基于这一认知,我们可以进一步探讨:当机器人技术突破临界点,更智能的机器人将如何应用?机器人是否必须采用人形设计?训练数据的获取瓶颈如何突破?本文将深入探讨这些问题,但需注意人形机器人作为新兴赛道,许多问题尚无定论,欢迎读者在评论区交流讨论。人形机器人是一个具有广阔前景的赛道,能够带动众多细分领域的发展。以特斯拉机器人Optimus为代表的硬件全景图,展现了人形机器人的巨大潜力。当机器人技术达到突破临界点,更智能的机器人将如何应用?曾经,机器人领域迭代速度相对较慢,如今汽车工厂中已广泛应用工业机器人,并拥有数十年的应用历史,但这类机器人多为非通用智能机器人。其瓶颈在于,工业机器人等非通用智能机器人(通常只是机械臂)只能在特定场景执行特定任务,其动作和反应算法都是预设的,一旦遇到新情况或环境变化,若无预先编写的算法应对,就会立即表现出“智能不足”。如今,通用机器人的出现可能改变这一现状,极大扩展机器人的潜在应用场景。过去,工业机器人只能在流水线的单点执行任务,如拧螺丝或组装部件,但有了通用机器人,只需教会其安装逻辑和评估标准,不仅能拧螺丝,还能在螺丝用完后自行从仓库取用,或配备灵巧手处理更复杂的任务。此外,结合大语言模型(LLM),我们还可以实现语音控制,只需说出“请给我拿杯水”,系统将语音转换成代码,再转换成机器人的动作。这并非影视剧中才有的场景,而是正在发生的现实。今年谷歌发布Robotics Transformer-2(RT-2),微软发布“ChatGPT for Robotics”论文,为整个机器人行业带来巨大震动。这些新进展与过去“每做一套新动作就需要重新编程一次”的机器人相比,存在天壤之别。未来,无论是在工厂车间、商场还是家庭,都可能出现通用机器人,适应不同环节,无需重新编程即可在不同任务间灵活切换。目前,大多数通用机器人创业公司的首要目标并非ToC(消费者市场),而是ToB(商业或工业场景)。先在B端场景中打磨技术,再逐步应用于C端,是许多公司的战略规划。汽车生产是许多公司优先考虑的场景。汽车工厂规模庞大,自动化程度较高,许多环节已通过工业机器人实现流水线作业,但仍需大量人工操作。例如,在汽车工厂的总装车间,仍需大量人力,人形机器人可以替代这些环节,而非替代已实现自动化的部分。智元机器人的人形机器人应用在汽车工厂的案例。按照马斯克的计划,特斯拉首批机器人主要应用于B端,替代危险、枯燥、重复的工作,或人类不愿承担的任务。第二批大规模使用的机器人将具备现实世界导航能力,利用特斯拉电动车的视觉导航技术,无需特定指令即可执行有用任务;第三批则预计在10年后,人们可以在家中使用机器人。除了汽车工厂,3C产品的组装、检测等环节,以及商业场景中的零售业货架管理、清洁等,仍有大量人工需求。随着社会老龄化及人力成本上升,将出现巨大的劳动力缺口需要填补。当然,并非所有场景都必须采用人形机器人,应根据实际需求选择。宇树科技创始人兼CEO王兴兴曾表示,四足机器人相比双足机器人,具备更高的载荷能力、更强的平衡能力,且更易于控制、设计和维护,在工业端和消费端均有广泛应用场景,尤其适合在危险环境中替代人类作业。鸿海、软银投资的日本机器人初创公司Telexistence,可作为商超货架的补货机器人。然而,当前的通用机器人距离真正商业化落地仍面临诸多挑战。最明显的是成功率、执行速度和精度仍需提升。例如,谷歌的RT-2相比RT-1,执行成功率提升至80%,但在实机演示中仍出现错误,如将柠檬味苏打水误识别为“橘子味”,或回答“桌子上有什么水果”时说成“白色”而非实际存在的香蕉。谷歌解释称,因WiFi临时中断,机器人使用了缓存答案。虽然80%的准确率在一些场景可用,但在需要高精度的场景仍不足够。当然,我们探讨了具身智能和通用机器人,但并不意味着工业机器人领域没有机会,只是发展逻辑不同。在传统机械设备领域,仍有大量机器人零部件创新和国产替代的机会。例如,工业机器人的核心零部件减速器长期被日本和德国公司垄断,工业机器人整体国产化率仅为35%,尤其在汽车3C、焊接等细分赛道,国产化率偏低,结合智能化仍有成长空间和创新潜力。机器人是否必须采用人形设计?在无数科幻影视作品中,人形机器人一直是人类对机器人的终极想象,相比工业机器人,人形机器人代表着更高维的存在。但由于实现难度极大,长期以来并非机器人行业的主要形态,直到最近一年特斯拉推出人形机器人Optimus,才成为市场焦点。市场对此也存在诸多质疑:我们是否真的需要人形机器人?实现难度如此之大,何时才能在现实生活中落地?是否应先从机械狗、多轮底盘+机械臂等形态入手,而非直接追求人形?目前尚无确切答案。我们看到谷歌搭载RT-2的机器人,采用轮式底盘+单机械臂设计,已能实现捡拾小物、开窗户、垃圾筛选等功能。这种单臂、轮式服务机器人无需灵巧手或仿人腿的运动控制系统,也能满足许多家庭、工厂场景的需求。当然,其局限性在于无法上下楼梯。我们的观点是人形是终极形态,因为相信最终机器人将进入千家万户。但根据不同场景需求,其他形态的机器人也将共存,如不一定是双足双臂,更早出现的可能是轮式单臂。人形机器人的优势在于应用范围。从终局思维来看,人形机器人最适合社会所有场景,因为人类社会的建筑、工具等都是基于人类身形设计的,无需改变场景适应机器人,即可直接使用人类社会的所有工具。这也符合马斯克提出的愿景,即未来人类不想干的事都可以交给机器人,甚至发掘出目前尚未预料到的用途。例如,人类的腿和手在仿生步态下,机器人的运动能力远超传统履带、四轮、双轮机器人,可上下楼、跳跃过障碍物。对于手来说,基于空心杯电机的灵巧手可实现双手配合和工具替换,比传统工业机器人能使用更广泛的人类工具,技能更丰富。其次,从交互角度看,“人形”能传递丰富的肢体语言、面部表情等信息。心理学家梅拉宾法则强调肢体语言的作用,肢体语言最符合人类认知,人类无需重新学习即可轻松理解机器人的动作。结合大语言模型后,人机交互将更加流畅。例如英国Engineered Arts公司的人形机器人Ameca,输入大量真人表情数据,通过立体3D打印机制作出精确模具,实现了生动的面部表情和肢体语言。Ameca能在橡胶皮肤上表现出超过62种面部表情,这是其著名的“苏醒时刻”。尽管人形机器人优势明显,但最大的制约仍是软硬件技术的高难度。从每个关节的设计到运动控制、环境感知,每个环节都存在技术难题,综合起来对系统的集成度和鲁棒性要求极高。例如运动控制的标杆波士顿动力,成立31年,历经被谷歌、软银、现代集团收购,持续投入,虽实现了“跑酷”等炫酷功能,但背后是不计成本的投入、功耗极高、噪音很大,距离量产落地仍很遥远。不过,如果一家公司以人形机器人为目标,不代表其产品只有一款人形机器人。在攻克高难度技术过程中,无论是移动、抓取还是视觉感知等方面,都可以迭代出新的产品,最终将各项技术组合在一起。简单来说,人形机器人是最难的机器人形态,谁能做好人形,谁就能做好其他形态的机器人。总之,机器人的通用性和智能化是未来重点,但不一定非要是人形,当前仍需根据场景需求选择。训练数据是瓶颈,数据还能从哪里来?能否获取高质量且成本可控的数据,是当前制约智能机器人发展的关键,也是拉开公司间竞争差距的重要手段。前车之鉴是Everday Robots,曾是谷歌的明星独立项目,但在今年2月因成本控制被谷歌解散,并入其他部门。造成Everday Robots成本高昂的重要原因之一是数据采集成本过高。OpenAI也曾有机器人部门,但后来放弃,问题也出在数据收集上。为何采集成本如此之高?主要是因为Everday Robots基于真实环境采集数据。谷歌为训练PaLM-E,用了13台机器人,收集了17个月的数据,若在更复杂的工业场景,数据采集成本会更高。目前,人形机器人主流的数据获取手段有四种:遥操作数据:这是目前最主流的方式,特斯拉等机器人公司都在使用。这种方式基于人工遥操作,先学习人类动作,再对应到机器人。由于使用真实世界数据,数据质量最高,但采集成本也最高。机器人的遥操作模拟器数据:由于遥操作成本过高,基于模拟器生成仿真数据的方式越来越受欢迎。一方面,合成仿真数据可大幅扩展数据集,此外仿真场景还可补充现实中较少出现的任务。在导航、抓取物品等任务中,仿真表现不错,但在流体运动、物体破裂等对真实物理数据要求高的场景,仿真仍难以完全模拟。但模拟器并非万能,如何构建丰富的3D内容、设置合适的奖励机制等,也是其面临的问题,此外还有算力成本。视频数据:鉴于线上视频网站中存在大量第一人称视角视频,这些视频可让机器人或AI学习,都是真实人类活动的视频,通过图像训练机器人的行为决策,可快速低成本实现数据积累和泛化能力。目前学界和谷歌等大厂,都在尝试这种方式加速训练。模仿学习:这种方式仍在研究中,即让人直接在机器人面前演示一遍,机器人即可学会。例如在家庭场景中,扫地或把脏衣服放进洗衣机等动作,可能只需教几遍,无需额外采集数据,也不需要动作捕捉。已有不少相关论文发表。总之,具身大数据对机器人至关重要,缺乏具身数据很难训练出真正好用的具身基础模型。目前,每条数据获取的技术路径上,都有公司或高校在尝试,许多公司也混合使用多种方式,以最快速度和最低成本获取高质量数据。今年,机器人在真实环境中的规划、感知、决策、执行等能力大幅提升,通过语音直接控制成为可能,人机交互也显著增强。在这种智能化、通用性发展趋势下,通用机器人的应用领域被极大拓宽,人形机器人的商业化也成为可能。通用机器人还将推动工业制造能力飞跃,从只能机械完成代码指令的工业机器人,变成能使用大量人类工具、载具的通用机器人。而在工业制造领域,无论是在机器人零件端,还是工业制造的应用场景、训练所需的数据成本等方面,中国更具优势。英伟达创始人黄仁勋在ITF World 2023大会上表示,人工智能的下一个浪潮将是具身智能,即能理解、推理、并与物理世界互动的智能系统。而通用机器人,无疑是理想的载体。本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年08月06日

11:07
DeepSeek年初引爆国内大模型热潮以来,人工智能技术正以前所未有的速度渗透中国互联网生态的各个角落。QuestMobile最新发布的2025年AI应用市场半年报揭示了一个重要趋势——在竞争激烈的市场环境中,AI应用插件正成为新的增长引擎,推动整个行业迈向新的发展阶段。 AI应用市场呈现四大梯队格局 报告显示,2025年上半年AI应用市场发展迅猛,形成了明...
11:07
AI音频生成领域的领军企业ElevenLabs于周二正式发布革命性音乐生成模型,并惊喜宣布用户可将创作成果用于商业用途。这一创新举措标志着这家成立仅三年的独角兽公司首次跨越核心业务边界,正式进军竞争白热化的AI音乐创作市场。此前,ElevenLabs凭借在文本转语音AI产品领域的卓越表现稳居行业领先地位,随后逐步拓展至对话机器人与跨语言语音翻译工具开发。此次...
11:07
销售自动化创业公司Clay正式宣布成功完成1亿美元C轮融资,公司估值飙升至31亿美元,这一里程碑式融资由谷歌母公司Alphabet旗下的CapitalG强势领投。这一消息印证了TechCrunch早在6月份的深度报道。Clay的融资步伐堪称业界奇迹,其发展速度令人瞩目。仅仅六个月前,该公司刚刚敲定12.5亿美元的B轮融资,随后数月内又宣布了由红杉资本牵头的1...
11:07
近日,LegalZoom.com,Inc.(纳斯达克代码:LZ)正式宣布与OpenAI达成战略合作,共同推出一款革命性的法律指导服务。该服务深度融合了OpenAI最新研发的ChatGPT代理功能,使ChatGPT能够全面接入LegalZoom海量法律资源库,通过尖端人工智能技术为全球用户提供专业、精准的法律信息与建议。图源说明:本图片由人工智能生成,图片授权...
11:07
2025年8月6日,硅铁期货市场迎来强劲反弹,主力合约日内涨幅显著扩大至4%。这一波动不仅反映出市场对硅铁供需关系的重新评估,也凸显了相关产业链上下游企业的密切关注。近期,受全球宏观经济环境变化及原材料价格波动等多重因素影响,硅铁市场呈现出复杂多变的走势。然而,今日的显著上涨为市场注入了一剂强心针,显示出投资者对行业未来发展的乐观预期。分析师指出,此次涨幅可...
11:07
2025年8月6日,华为算力概念板块迎来显著的市场关注,板块内个股普遍呈现强劲上涨态势。其中,东方国信股价涨幅突破10%,表现尤为抢眼,而直真科技、品茗科技、彩讯股份、云从科技、润和软件、华孚时尚等企业也纷纷掀起冲高行情。这一轮局部异动背后,或与市场对算力需求持续增长的积极预期密切相关,进而有效带动了整个产业链相关个股的活跃度提升。随着数字化转型的深入推进,...
11:07
今日,同步磁阻电机板块强势崛起,整体涨幅高达2.4%,成为市场焦点。板块内个股表现亮眼,其中卧龙电驱以3.68%的涨幅领跑,新时达紧随其后,上涨2.89%,而伟创电气也录得0.59%的稳步增长。此次板块整体上涨,主要得益于市场对高效节能电机需求的持续升温。随着绿色能源和节能减排理念的深入推进,高效节能电机正逐渐成为各行业升级换代的标配选择,其市场潜力与投资价...
11:07
2025年8月6日,数字水印板块迎来强势崛起,整体市场涨幅高达2.42%,成为当日资本市场的焦点之一。板块内个股表现亮眼,东方国信更是以惊人涨幅15.3%领跑全板块,展现出其强劲的增长动力。紧随其后的是恒信东方,涨幅达到3.8%,汉邦高科也录得2.61%的显著增长。此外,平治信息与科蓝软件的涨幅均突破2%,进一步印证了数字水印行业的蓬勃发展趋势。此次板块的集...
11:07
2025年8月6日,港股市场迎来了一波苹果概念股的强劲表现,相关企业股价纷纷走高,展现出市场对苹果产业链的高度关注。其中,比亚迪电子股价涨幅惊人,一度飙升超过10%,成为当日表现最亮眼的个股之一。紧随其后的是瑞声科技,其股价也录得了5.7%的显著涨幅,显示出该企业在产业链中的强劲竞争力。此外,舜宇光学科技同样交出亮眼答卷,股价上涨幅度超过2%,进一步印证了市...
11:07
2025年8月6日,港股市场早盘呈现一片繁荣景象,黄金板块成为焦点,多只相关股票逆势上涨,展现出强劲的市场活力。其中,山东黄金(01787)表现尤为抢眼,股价大幅攀升3.09%,最终报收于28港元,彰显其作为行业龙头的市场地位。紧随其后的是中国黄金国际(02099),其股价同样劲升2.98%,报70.95港元,进一步巩固了公司在黄金领域的领先优势。此外,招金...
11:07
2025年7月下旬,国内重点钢铁企业的生产数据显示出明显的结构性变化。粗钢日产量从上个月同期的平均198.2万吨下降至7.4%,降至191.4万吨,反映出市场对高炉产能的调控力度有所加大。与此同时,生铁日产量也呈现同步回落态势,环比减少4.5个百分点,降至185.6万吨,显示出钢铁行业对原材料供应的谨慎态度。值得注意的是,钢材综合日产量反而微幅上涨0.5%,...
11:06
近期,一部名为《九尾狐男妖爱上我》的AI生成短剧在社交平台掀起热潮,抖音单平台播放量已突破1.8亿次。该剧从场景设计到角色塑造完全由AI完成,尽管网友纷纷吐槽"画面质感堪比PPT""九尾狐尾巴活像鸡毛掸子",但剧情中频繁的反转桥段与猎奇元素却成功吸引大量观众持续追更。目前该剧已连续更新27集,热度依旧不减。据制作人辣糖透露,AI短剧的制作周期比传统影视项目缩...