具身智能正成为全球科技产业的热点赛道,中国行业领军企业宇树科技的上市进程正在加速推进,而中美科技巨头则在水下更深层领域展开宏大布局。今年3月,在GTC2025主题演讲中,英伟达CEO黄仁勋通过挪威机器人公司1X的NEO Gamma人形机器人,展示了基于英伟达GR00T N1模型构建的后训练策略应用。这款机器人成功执行了自主整理任务,黄仁勋借此强调人形机器人发展的核心在于适应性和学习能力,即机器人的实际效能取决于其”大脑”能否灵活适应环境并持续学习新知识。这一观点很快得到验证。仅半年后,全球科技巨头在”机器人大脑”领域取得重大突破。8月,英伟达推出Jetson AGX Thor边缘计算平台,被业界誉为”机器人新大脑”。Thor作为面向机器人和物理设备的新一代技术栈,基于Blackwell GPU架构,峰值算力达2070FP4TFLOPS,较现有Jetson AGX Orin模块提升7.5倍,能效提升3.5倍。其最大突破在于实现单一紧凑模块的实时感知与决策,无需依赖云端处理或多芯片架构。目前亚马逊仓储机器人、波士顿动力等早期用户已开始集成Thor,致力于打造更智能、更独立的机器人产品。
地球另一端,字节跳动在机器人领域同样动作频频。7月和9月先后推出自研通用机器人模型GR-3和Robix,展示了在真实家庭场景下执行复杂任务的能力。7月底发布的演示视频中,搭载GR-3的ByteMini机器人完成了衣架插入衬衫并挂起的任务,还能区分不同尺寸物品并执行”拿起较大的盘子”等指令。上周,Seed团队又发布了Robix成果,与GR-3共同构成新一代机器人模型矩阵。从黄仁勋GTC2025的感慨到如今的技术成果,字节与英伟达在机器人赛道展现出惊人同步性,仿佛”想到一块去了”。
在Thor问世前,英伟达已稳居机器人赛道头把交椅。其Jetson平台在高端机器人和自主开发领域占据主导地位,拥有超过200万名开发者和7000多家企业使用Orin系列产品。今年8月正式开售的Thor,从硬件性能和成熟度上几乎处于同类产品绝对领先地位。英特尔、高通等竞争对手的边缘AI产品尚无法在单一模块中实现同等集成计算。更关键的是,英伟达通过硬件与软件栈紧密绑定,依托CUDA工具包的广泛应用,构建起生态护城河。Thor可直接调用英伟达完整Isaac机器人软件平台、AI模型库和仿真工具,实现端到端深度集成,其中包括针对机器人场景的最新开源预训练模型GR00T N1。该模型采用受人类认知启发的双系统架构,一个系统负责类似人类反应的快速行动,另一个系统通过推理环境指令规划行动。1X公司CEO Bernt Børnich表示:”GR00T N1显著提升了机器人推理能力,我们仅用少量后训练数据就完成NEO Gamma部署。”
然而Thor并非完美。首先是价格,开发套件售价3499美元,难以普及。其次是对供电要求较高,适配产品需具备稳定供电能力。在”机器人大脑”赛道,英伟达很快迎来中国劲敌。7月底发布的GR-3模型,在演示中完成衣架插入衬衫、拾取家居用品等高难度任务,还能区分不同尺寸物品。技术报告显示,GR-3能理解复杂抽象语言,如”较大的盘子””左边的椅子”等。其混合训练方法——先输入大量图像文本数据,再通过虚拟现实环境微调,最后学习现实机器人动作——赋予其复杂环境适应性。据Meta前AI科学家Chris Paxton披露,字节40亿参数GR-3表现优于英伟达20亿参数GR00T,印证了”规模定律”在机器人领域依然有效。但GR-3更像是机器人肢体的”神经元”,Seed团队最新成果Robix则负责任务规划、推理、自然语言交互等”大脑”功能。Robix被描述为集推理、规划和自然交互于一体的统一机器人大脑,性能优于GPT-4o和Gemini2.5Pro。但测试显示,Robix仍需搭配GR-3等VLA模型完成具体动作执行,其双系统模式与GR00T N1有共通之处。
字节在机器人VLM领域并非首次发力。作为互联网内容公司,字节实则是一位低调的”隐形巨头”。2023年12月推出GR-1,采用大规模视频预训练+机器人数据微调模式;2024年推出GR-2,基于3800万段视频、超500亿token数据预训练,在100多个操控任务中平均成功率97.7%。字节机器人探索始于2020年,张一鸣不定期参与项目讨论。两年间已量产1000余台物流机器人,聚焦仓储自动搬运一体化方案。这些早期积累为Robix、GR-3和ByteMini的技术发展奠定基础。近期字节招聘官网涌现大量机器人相关岗位,包括”下一代通用机器人”职位,均属Seed团队,base北京上海,团队规模预计超300人。字节在机器人产业也积极投资,宇树科技C轮融资中锦秋基金身影引人注目,该基金由原字节财务投资负责人杨洁创立,核心成员多来自字节投资体系,其名称”锦秋”源自张一鸣创业时的发源地——北京海淀锦秋家园。
字节正在公司内外加速布局机器人领域。目前技术积累主要在模型层面,与英伟达最新芯片方案形成优势互补。多年来字节是英伟达中国重要客户,黄仁勋深知中国企业对具身智能市场的重要性。今年7月他现身北京链博会表示:”AI下一波浪潮将是机器人,未来机器人将真正理解物理世界。”中国市场在这条路径上具有不可替代意义。英伟达博客显示,联影医疗、万集科技、优必选等国内公司已使用Thor,但字节尚未出现在名单中。宇树科技CEO王兴兴评价Thor”带来计算能力巨大飞跃,赋能机器人更强的敏捷性和自主水平”。2025年1月CES展上,黄仁勋与14家合作的人形机器人公司登台,其中6家来自中国,包括宇树科技和小鹏。
另一方面,字节Seed团队并非只聚焦模型领域。测试GR-3和Robix过程中同步推出的ByteMini,虽看似实验性产品,但规格不低——22个自由度、球形腕设计,在狭小空间操作能力突出。其出现已显示字节打造下一代具身智能产品的野心。随着英伟达Thor问世,想到一块去的黄仁勋和张一鸣,或许将在机器人领域延续两家头部企业的合作关系。