谷歌DeepMind双AI机器人突破单一任务限制实现协同思考

机器人技术正迎来一场颠覆性的革命。谷歌DeepMind最新发布的Gemini Robotics项目,通过两个协同工作的创新模型,首次实现了机器人行动前的”思考”能力,这一突破可能彻底打破当前机器人仅能执行特定任务的局限。生成式AI技术已在文本、图像、音频和视频创作领域广泛应用,如今正被应用于生成机器人动作指令。DeepMind团队认为,生成式AI对机器人技术具有特殊意义,因为它能解锁通用功能特性。

当前机器人面临的核心困境是过度专业化。每个机器人都需要针对特定任务进行密集训练,在执行其他任务时表现不佳。谷歌DeepMind机器人部门负责人Carolina Parada指出:”当今的机器人高度定制化且部署困难,通常需要数月时间才能安装一个只能执行单一任务的机器人单元。”生成式系统的基本特性使AI驱动的机器人更具通用性。它们能够应对全新环境和工作空间,无需重新编程即可适应。

DeepMind当前的机器人技术采用双模型协作方法:一个负责思考,一个负责执行。这两个新模型分别命名为Gemini Robotics1.5和Gemini Robotics-ER1.5。前者是视觉-语言-动作模型,能利用视觉和文本数据生成机器人动作指令;后者中的”ER”代表具身推理,是一个视觉-语言模型,接收视觉和文本输入后生成完成复杂任务所需的步骤。Gemini Robotics-ER1.5是首个具备模拟推理能力的机器人AI系统,其推理过程类似于现代文本聊天机器人。

谷歌DeepMind双AI机器人突破单一任务限制实现协同思考插图1

DeepMind称其为”思考”能力,尽管在生成式AI领域这个术语可能并不完全精确。据DeepMind介绍,ER模型在学术和内部基准测试中都取得顶尖成绩,表明它能够对如何与物理空间交互做出准确决策。但它本身不执行任何动作,这就需要Gemini Robotics1.5的配合。以分拣衣物为例:当需要机器人将一堆衣物分成白色和彩色两类时,Gemini Robotics-ER1.5会处理这个请求并分析物理环境的图像。这个AI系统还能调用谷歌搜索等工具收集更多数据。然后ER模型生成自然语言指令,为机器人提供完成任务所需遵循的具体步骤。

这种双模型架构的创新之处在于将推理和执行分离。推理模型专注于理解任务需求和环境状况,制定详细的行动计划;执行模型则负责将这些计划转化为具体的机器人动作。这种分工协作的方式使机器人系统既具备复杂的思考能力,又保持精确的执行效率。

从技术发展趋势来看,这一突破可能标志着机器人技术从专用化向通用化的重要转折点。传统机器人需要针对每个新任务进行大量训练和调试,而具备生成式AI能力的机器人理论上可以通过自然语言指令快速适应新的工作场景。当然,这项技术仍处于早期阶段,实际部署中可能面临各种挑战。机器人在复杂真实环境中的表现、安全性保障、成本控制等问题都需要进一步解决。但DeepMind的这一尝试无疑为机器人技术的未来发展指明了一个极具前景的方向。随着AI技术的持续进步,我们可能即将见证机器人从单一任务执行者转变为真正的智能助手的历史性时刻。

最新快讯

2025年11月28日

23:14
2025年11月28日,领先的物联网通信解决方案提供商广和通正式宣布一项具有战略意义的资本布局计划,即设立一家注册资本达5000万元人民币的全资子公司。这家新公司将扎根于江西省上栗县这片充满活力的工业热土,展开一系列高规格的投资项目,总投资额高达4亿元人民币,标志着广和通在产业升级和区域经济协同发展方面迈出重要步伐。 此次投资将采用双轨并行的策略:一方面,公...
23:14
2025年11月28日,备受瞩目的工业自动化领军企业东方精工正式发布重大战略举措,宣布计划以现金方式出售旗下Fosber集团等三家全资子公司的100%股权。根据相关公告,此次资产剥离交易预计将构成重大资产重组,标志着东方精工在产业布局上迈出关键性调整步伐。 此次出售决策主要源于公司对资产结构的深度优化考量,旨在通过战略收缩进一步聚焦核心业务领域,强化在精密传...
23:14
2025年11月28日晚间,美团公司在第三季度电话会议中发布了备受关注的市场数据,揭示了其业务发展的最新动态。数据显示,近期美团餐饮外卖订单市场份额呈现稳步回升的良好态势,展现出平台在激烈市场竞争中的稳健表现。特别是在中高价订单市场,美团凭借卓越的品牌影响力和用户粘性,持续巩固其行业领先地位,GTV(Gross Transaction Value,总交易额)...
23:14
2025年11月18日,备受期待的《生化危机:生存小队》震撼登陆全球市场,其惊人的传播力在短短10天内便创下下载量突破200万的辉煌纪录。这款由Aniplex与Joycity强强联手联合开发,并得到卡普空官方授权与深度协作的移动端衍生作品,凭借其独特的策略玩法核心,迅速吸引了全球玩家的目光。游戏以一座阴森诡异的神秘医院为故事起点,玩家将化身为被保护伞公司秘密...
23:13
2025年11月28日,大唐重庆江津燃机项目传来喜讯,成功实现全容量投产发电,标志着国内“F”级改进型单轴重型燃机技术取得重大突破,填补了该领域的空白。这一里程碑事件不仅彰显了中国能源装备制造的实力,更为西部地区的能源结构优化注入强劲动力。 该项目坐落于重庆江津区,总投资额高达26亿元人民币。工程精心规划,建设了两台54.68万千瓦燃气-蒸汽联合循环机组,总...
23:13
2025年11月28日,日本知名家电巨头松下公司正式发布声明,宣布将对其生产的30至40种钽电容产品实施价格上调,涨幅区间在15%至30%之间。此次价格调整主要受原材料与生产成本持续上涨的双重压力影响。值得注意的是,这些被提价的钽聚合物电容在当前高科技领域具有广泛的应用价值,特别是在AI服务器等前沿设备中扮演着关键角色。 尽管日元近期汇率走弱对松下的出口业务...
22:40
2025年11月28日,德国知名媒体报道了一则引人关注的消息。据《法兰克福汇报》最新披露,德国领先的在线外卖服务平台Lieferando宣布对其组织架构进行重大调整,计划裁员1500人。这一数字虽然较先前宣布的2000人目标有所减少,但依然意味着公司将在人员配置上做出显著优化。 此次裁员的核心目标在于优化运营结构,提升企业长期经营效率。根据Liefera...
22:40
2025年11月28日,国际商业机器公司(IBM)宣布一项重大战略决策,计划在加拿大大幅提升其芯片制造能力。根据最新消息,IBM将对其位于加拿大的自有半导体制造设施进行全面的升级改造,并同步扩大生产规模。这一系列扩产举措旨在积极应对全球芯片市场持续升温的需求态势,显著增强IBM在高性能计算芯片领域的供应链稳定性和供应效率。 此次扩产计划的核心目标在于强化IB...
22:39
2025年黑色星期五线上消费预计将突破117亿美元大关,创下历史新高,同比增长8.3%。这一惊人数字不仅彰显了美国消费者对线上购物的热情,更凸显了电子商务在假日季中的主导地位。Adobe最新发布的预测显示,“网购星期一”销售额有望达到142亿美元,较去年增长6.3%,再次刷新销售纪录。两大购物节销售额的持续攀升,不仅反映了消费者线上购物需求的强劲,也揭示了电...
22:39
2025年11月28日,生态环境部在一场备受关注的新闻发布会上正式宣布,我国正全面启动“四机一脑”等退役装备的规范拆解与循环利用计划。这一重要举措旨在推动资源高效回收,促进绿色可持续发展。生态环境部强调,将严厉打击非法处置废弃机电产品的行为,并将其纳入全国范围的专项整治行动中。 为鼓励合规企业积极参与,相关部门创新性地推出了“以奖代补”的政策措施,通过资...
22:39
2025年11月,澳大利亚气象局(BOM)正式推出全新官方网站,这场耗资高达9650万澳元的改版工程却引发了一场前所未有的风波。令人咋舌的是,实际支出远超预算近20倍,这一惊人的数字迅速点燃了公众的质疑。新版网站上线后,其糟糕的用户体验和功能缺失问题如雪球般发酵,迅速在用户群体中掀起轩然大波。尤其是降雨雷达混乱的配色方案,以及无法通过GPS坐标精准查询天气等...
22:39
11月28日下午4时20分,印尼北马鲁古省的伊布火山突然爆发,引发广泛关注。根据印尼火山地质减灾中心的权威监测数据,此次火山喷发持续时间长达74秒,喷发出的火山灰柱直冲高空,最高可达约800米,场面十分壮观。这一突发性火山活动已引起相关部门的高度重视,他们已紧急启动应急预案,加强了对火山的实时监测力度,并第一时间向附近居民发布安全预警,提醒大家做好防范措施。...