谷歌DeepMind团队于9月25日震撼发布了两款突破性的AI模型——Gemini Robotics 1.5与Gemini Robotics-ER 1.5,这两款专为物理世界交互而生的智能系统将重新定义人机协作的未来。新系统基于创新的”大脑-身体”协作框架,致力于构建能够全面感知环境、精准规划行动、深度思考决策并高效执行任务的物理智能体。
Gemini Robotics-ER 1.5作为”高层大脑”,展现出业界领先的空间理解能力,能够主动搜索关键信息并制定详尽行动计划。该模型的核心优势在于能够将自然语言指令转化为机器人可执行的复杂任务,实现人机交互的智能化升级。更令人瞩目的是,新模型突破了传统AI的局限,具备”先思考后行动”的理性决策能力,能够生成内部推理序列以深度理解任务语义,大幅提升任务执行的准确性与效率。
值得一提的是,Gemini Robotics系列展现出卓越的跨机器人形态学习能力。通过这一创新技术,ALOHA 2机器人学到的关键技能可以直接迁移至Apollo人形机器人等不同形态的设备上,真正实现了AI能力的通用化与可扩展性。这种跨形态的技能迁移能力将极大降低机器人开发成本,加速智能机器人的普及进程。
目前,Gemini Robotics-ER 1.5已通过API向全球开发者开放,为机器人开发者提供了强大的技术支持。这一开放举措将推动AI与机器人技术的深度融合,为各行各业带来革命性的变化。随着智能机器人技术的不断成熟,我们有望见证人机协作新时代的全面到来。
