大厂、初创都在卷,未来已来

编者按:本文来自微信公众号 硅兔赛跑(ID:sv_race),作者:椎名,编辑:Zuri,微想智云经授权转载。没能搭上AIGC第一班列车的人们,目前最关心的问题就是AI下一波浪潮将如何发展。继续大模型?All in AIGC应用?还是回归“卖铲子”的逻辑?对ChatGPT“眼红”不已的马斯克告诉我们——未来人形机器人的数量将远超电动车;AI界最大的卖铲子的公司英伟达CEO黄仁勋点出——下一波AI浪潮是「具身AI」(Embodied AI);AI顶流公司OpenAI也暗戳戳地发出信号——投资了一家「具身AI」公司。这是一种能够理解、推理并与物理世界交互的智能系统,如同它的英文名一样,它比现阶段的AI形态,多了一个“body”。

那么,应该如何理解“具身”的重要性?为什么在黄仁勋看来,AI下一步需要有身体?又有哪些初创企业在这个挑战和前景并存地赛道上蓄势待发?

01 大佬之间的默契

第一代AI,是基于规则和逻辑的符号推理系统。它依赖于人工编程的规则和知识来解决特定问题,但在处理复杂的现实世界问题上受限较多。

第二代AI,在大数据和统计方法兴起后出现。这一阶段的关键是将大量数据输入机器学习算法中,使机器能够从数据中学习模式和规律,而无需显式编程。这包括传统的机器学习算法(如决策树、支持向量机等)和神经网络技术。

第三代AI,指的是当前和未来的人工智能技术,强调综合运用不同的方法和技术来解决更加复杂的问题。这包括结合机器学习、深度学习、自然语言处理、计算机视觉、强化学习等多个领域的技术,以提高智能系统的能力和效果,ChatGPT就是其中的典型代表。

而现在,具身AI创造了一种机器自主学习的新方式,能够以第一人称的视角来感知和学习物理世界,并像人类一样理解和感知事物,物理世界的学习不亚于互联网虚拟信息的学习。黄仁勋认为机器人、自动驾驶汽车,甚至包括因为理解物理世界而变得更加聪明的聊天机器人,都属于“具身AI”的范畴。马斯克在特斯拉股东大会上展示的人形机器人——擎天柱(Optimus),同样也是“具身AI”。马斯克对它的期望是,记忆周遭环境,轻松拿取任何物体。

这两位产业界大牛,一位主宰AI底层芯片,一位主宰终端设备,两位懂技术又懂商业的大佬不约而同地选择押注“具身AI”,应该是看到了具身化的人工智能系统将在许多领域带来重大的技术和商业突破的潜力,更重要的是,也能延续这两家公司新的业务增长曲线。

事实上,过去几十年来,「具身AI」经历了持续的技术突破和理论发展。早期的研究主要集中在机器人的感知和运动控制能力上。随着传感器和执行器技术的进步,研究人员开始设计和构建能够模仿人类动作和行为的机器人。这些机器人能够通过视觉、听觉和触觉感知环境,并自主执行任务。然而,由于技术和成本的限制,「具身AI」在过去一直局限于研究实验室和工业领域。

黄仁勋马斯克押注具身AI AI下一波浪潮已来插图

直到最近几年,随着计算能力的提升、传感器成本的下降以及人工智能算法的进步,「具身AI」迎来了新的发展机遇,创业公司和研究机构开始关注将“具身AI”技术转化为实际应用的商业机会。

02 绕不过去的存在

要了解「具身AI」的现状,必须从波士顿动力的过去开始。这家从MIT走出来的「具身AI」公司,成立于1992年,最早的资金来自美国国防高级研究计划局(DARPA)。后来,他们不断推出新的机器人系列,以其惊人的具身化人工智能技术而闻名于世,无论是能够像人一样行走的机器人Atlas,还是能够以惊人速度奔跑和跳跃的机器狗Spot,它们展示出了前所未有的动态稳定性和机动性,可以进行高难度的动作和任务。

这些机器人背后的核心技术是波士顿动力团队对动态平衡和运动控制的精湛掌握。除了出色的性能,波士顿动力还不断改进和优化机器人的感知和决策能力,使其能够更好地理解和应对复杂的现实世界场景。

但这家顶尖技术公司,却因为技术过于超前、商业价值成谜的原因,一度经历波折、多次易主:2013年,谷歌(现在的Alphabet Inc.)收购波士顿动力公司。这次收购为波士顿动力提供了更大的资源和资金支持,使得公司能够进一步扩大其研发和创新能力。不过2017年,谷歌将波士顿动力转让给了日本软银集团。众所周知,软银创始人孙正义对机器人一直情有独钟,但软银支持的Pepper机器人并不算成功,目前已经停产。2018年,波士顿动力完成了一轮价值2.5亿美元的融资,由软银领投。这次融资的目的是进一步拓展波士顿动力机器人的应用领域,并加速产品的商业化进程。最终,2020年,韩国汽车制造商现代(Hyundai)宣布以11亿美元的价格收购波士顿动力20%的股权。

这三次“卖身”某种程度上也反映了,「具身AI」技术从未停止进步,但能否找到实现商业价值的落脚点,前途未卜。

但这并不妨碍一批新兴企业涌入。

03 OpenAI也押注

最近,一个挪威小镇的宁静被打破了,这里的一家初创企业频频见诸报端。1X Technologies,这家人形机器人公司宣布完成了由OpenAI创业基金领投的2350万美元融资。该公司称他们的宗旨是创造具有实际应用价值的机器人,以补充全球劳动力。成立于2014年,这家机器人公司致力于生产能够模仿人类动作和行为的机器人。1X Technologies打算利用这笔资金来加大对即将推出的双足机器人模型NEO的研发力度,并计划在挪威和北美大规模生产他们的首款商用机器人EVE。目前1X Technologies拥有约60名员工。

因为融资有OpenAI的参与,这一消息立刻引发了广泛关注,人们开始幻想着ChatGPT与机器人结合的无限可能。当然,这个目标可能离真实落地还有很长一段路要走。

黄仁勋马斯克押注具身AI AI下一波浪潮已来插图1

刚刚过去的5月,一家名为Figure的美国人工智能初创公司,宣布获得了一笔由Parkway Venture Capital领投的巨额融资——7000万美元,Figure认为,这笔资金将为他们打造通用型人形机器人铺平道路,其产品预计在未来几个月内推出市场。

虽然这家公司成立仅一年,估值尚未公开,但知情人士透露其估值超过4亿美元。Figure的创始人兼首席执行官Brett Adcock自掏腰包2000万美元,其他投资者包括Aliya Capital和Bold Ventures。

Figure的目标是开发能够适应不同环境并处理各种任务的通用型人形机器人,无论是仓储还是零售,都能使用。

另一家2015年成立的机器人公司Agility Robotics商业化进程更快,创始人Damion Shelton和Jonathan Hurst都是卡内基梅隆大学机器人专业的毕业生。这家公司的产品主打有行走能力的物流仓储机器人,并且发明了具有移动性和操纵能力的类人机器人Digit,自2020年7月开始商业化销售。

Agility Robotics于去年完成1.5亿美元的B轮融资,由领先的深科技投资公司DCVC和“安卓之父”Andy Rubin创建的Playground Global领投,亚马逊产业创新基金参投。

总的来说,OpenAI作为一家领先的人工智能公司,投资「具身AI」公司表明他们对该领域的重视和看好。「具身AI」在实现真正智能的机器人方面具有巨大潜力,可以带来更贴近人类的交互体验和更广泛的应用场景。再加上英伟达和特斯拉这样的科技巨头的看好,无疑会进一步加速该领域的发展。

AI的下一步,也许是时候将创新的火炬交给「具身AI」了。

本文为专栏作者授权微想智云发表,版权归原作者所有。文章系作者个人观点,不代表微想智云立场,转载请联系原作者。如有任何疑问,请联系http://gpt.idea2003.com/。

最新快讯

2025年11月22日

08:01
2024年11月21日,谷歌推出一则时长60秒的创意广告,巧妙借力热门音乐剧《Wicked》的经典叙事,将自家的Pixel Pro 10智能手机塑造成魅力四射的“坏女巫”Elphaba,而将苹果iPhone 17 Pro则定位为正义凛然的“好女巫”Glinda。这一别出心裁的比喻,不仅生动形象地暗示了iPhone 17 Pro的多项创新功能实则是借鉴自Pix...
08:01
2025年11月21日,苹果公司发布了一份突破性研究报告,揭示了一种创新技术——利用大型语言模型(LLM)分析音频与运动数据的文本描述,从而实现对用户活动的精准识别。这项名为“后期多模态传感器融合”的技术,巧妙地将原始传感器数据转化为易于理解的文本信息,例如“潺潺水流声”或“举重动作”,再由强大的LLM进行深度推理与判断。这种方法的独特之处在于,它既能够有效...
08:01
财联社11月22日讯 据权威消息源透露,备受瞩目的知名投资人比尔·阿克曼正积极筹备旗下传奇对冲基金潘兴广场(Pershing Square)的首次公开募股(IPO)计划。这一备受市场期待的举动预计将于2026年初正式启动,标志着潘兴广场这家长期在投资界独树一帜的机构正式迈向公开市场。 据悉,此次IPO的核心目标是通过公开市场募集大量资金,为潘兴广场未来的业务...
08:01
2025年11月21日,微软正式在Windows 11系统中推出两项创新Copilot功能,标志着其AI战略在操作系统层面的深度布局。首项功能是将Microsoft 365 Copilot直接集成到文件管理器中,用户只需将鼠标悬停在最近使用的文件上,即可快速获取文件摘要信息。这一设计不仅极大提升了文件检索效率,更值得注意的是,该功能全面支持Intel、AMD...
07:21
2025年11月22日,微软正式确认了Windows 11文件管理器(explorer.exe)存在的启动缓慢和响应迟缓问题,并公布了针对性的优化方案。为解决这一困扰众多用户的痛点,微软计划通过即将发布的系统更新,引入一项名为"窗口预加载"的创新功能。该功能的核心机制是在用户开机过程中,提前将文件管理器加载至后台内存,从而实现用户点击图标时的"零延迟"启动体...
06:49
2025年11月22日,全球能源巨头埃克森美孚正式宣布,将无限期搁置其雄心勃勃的全球最大氢气生产设施建设项目。这一重大决策不仅标志着清洁能源转型进程的一次重要调整,更折射出当前复杂多变的全球经济格局。公司首席执行官戴伦·伍兹在声明中明确指出,项目暂停主要源于两大核心因素:一是市场对高成本氢气的需求明显疲软,二是欧洲工业增长持续放缓与经济不确定性显著加剧。这些...
05:45
2025年11月22日,德国化工巨头科思创公司正式宣布,其与阿布扎比国家石油公司(ADNOC)之间达成的重大并购协议已获得德国经济部的最终监管批准。这一关键性进展标志着双方价值147亿欧元的收购交易距离完成仅一步之遥,为全球化工产业的格局演变注入新的活力。 此次并购协议的达成,源于ADNOC为强化自身在全球化工领域的战略布局所做的战略考量。作为中东地区最具影...
04:43
2026年1月22日,美国食品药品监督管理局(FDA)将组织一场备受瞩目的专家会议,对瑞典火柴公司提交的ZYN尼古丁小袋产品销售申请进行深入审查。此次评估将涵盖20种不同规格的ZYN产品,其中包含3毫克和6毫克两种尼古丁含量梯度,旨在为消费者提供更灵活的选择。该申请由烟草巨头菲利普·莫里斯国际旗下的瑞典火柴公司正式提出,核心目标是通过FDA的严格审核,获得减...
04:43
2025年上半年,德意志银行在贵金属交易领域取得了令人瞩目的成就,其收入成功突破1亿美元大关,强势回归行业顶尖行列。这一显著进步不仅彰显了该行在金融市场中的竞争力,更体现了其业务战略的成功实施。为了进一步提升市场参与度和服务质量,德意志银行已正式申请重新加入伦敦金银市场协会(LBMA),并争取成为该协会的做市商成员。一旦申请获批,该行将能够在交易时段内向LB...
04:43
2025年11月22日,美国电商巨头亚马逊正式宣布了一项规模庞大的裁员计划,将削减超过1800名工程师岗位。这一决定主要集中在公司的核心业务部门,包括云计算、人工智能以及设备研发等领域。受影响岗位主要分布在西雅图总部,以及奥斯汀和旧金山这两个重要的技术中心。亚马逊在官方声明中解释,此次组织架构调整旨在优化资源配置,提升整体运营效率,以更好地应对日益激烈的市场...
02:45
2025年11月22日,欧洲足联与欧洲足球俱乐部合资企业UC3正式宣布一项具有里程碑意义的合作成果:美国知名媒体公司派拉蒙+成功竞标,将在2027年至2031年期间,独家获得英国地区欧洲冠军联赛(欧冠)的主要转播权。这一消息震惊了整个体育传媒界,派拉蒙+凭借其雄厚的资金实力和先进的流媒体技术,最终击败了现任主要转播商TNT体育公司,赢得了这五年的转播合同。 ...
01:44
2025年11月22日,谷歌正式在美国市场推出其革命性的数据分析平台——BigQuery AI。这一创新平台由谷歌公司自主研发,通过深度整合人工智能技术,为企业提供前所未有的海量数据分析能力。BigQuery AI的核心优势在于其强大的自然语言查询功能,用户只需用日常语言即可轻松获取所需数据,极大降低了数据分析的技术门槛。此外,该平台还能自动生成深度洞察报告...