微新创想(Idea2003.com) 6月26日讯 机器人正以前所未有的速度融入我们的日常生活,但大多数机器人仍受限于单一功能的编程。尽管人工智能技术的飞速发展让机器人潜力无限,通用型机器人的研发却进展缓慢,主要瓶颈在于缺乏现实世界的训练数据。近日,谷歌DeepMind发布了一项突破性研究成果——名为RoboCat的自改进机器人AI代理程序,它能够在不同机械臂上自主学习执行多样化任务,并自动生成新数据以持续提升性能。
RoboCat代表了机器人学研究的重要里程碑。与以往只能执行特定任务的机器人不同,RoboCat能够解决并适应多种任务,并在真实机器人平台上完成应用。其学习速度远超现有最先进模型,仅需100个示范就能掌握新任务,这得益于其强大的数据基础和算法优化。这一创新显著降低了人工标注数据的依赖,为通用机器人研发开辟了新路径。
DeepMind研究科学家Alex Lee在接受TechCrunch采访时表示:”我们证明了单一大型模型可以在多个真实机器人实体上处理各类任务,并能快速适应新环境和任务需求。”RoboCat的设计灵感源自DeepMind的Gato模型,该模型已具备处理文本、图像和事件的能力。RoboCat通过整合模拟与现实数据集进行训练,其数据来源包括虚拟环境中的机器人模型、人类操控示范以及RoboCat自身的历史表现。
训练过程采用创新方法:研究人员先收集100-1000个人类操控的机器人示范,然后对RoboCat进行针对性微调,创建专用分支模型并重复训练1万次。通过分支模型产生的数据与原始示范数据共同扩充训练集,不断迭代优化新版本的RoboCat。最终版本在141种模拟和实际任务变体上完成训练,涵盖253项具体任务。
令人惊叹的是,RoboCat只需观察数小时的人类示范就能掌握不同机械臂的操作。尽管在四款双爪机械臂上训练,该模型仍能无缝适应具有三指夹爪和双重可控输入的更复杂机械臂。虽然DeepMind测试显示RoboCat在不同任务上的成功率差异较大(最低13%至最高99%),但当示范数量减半时,成功率相应降低。但在特定场景下,RoboCat仅需100个示范就能快速掌握新任务。
Lee进一步指出:”通过少量示范进行新任务微调后,RoboCat能自动生成更多数据以持续改进。”研究团队未来目标是将新任务学习所需的示范数量降至10个以下。这一突破性进展将极大推动机器人学研究进程,为未来通用型机器人的诞生奠定坚实基础。
阅读DeepMind完整论文:https://arxiv.org/abs/2306.11706