谷歌RT-2 AI模型：文本图像转化为机器人动作

2023-07-31 10:51:27 互联网 39 次阅读

微新创想(idea2003.com) 7月31日讯：在人工智能领域，谷歌再次引领创新浪潮。继能绘画的AI之后，谷歌最新推出的机器人控制AI模型——Robotics Transformer 2（RT2），将视觉、语言与动作完美融合，开创了人机交互的新纪元。这款先进的视觉-语言-动作（VLA）模型能够将文本和图像指令转化为精准的机器人动作，为未来智能机器人铺平了道路。

谷歌DeepMind的机器人主管Vincent Vanhoucke在博文中表示：”RT-2让我们离机器人的未来更近一步。”他解释道：”就像语言模型通过学习网络文本掌握思想概念一样，RT-2通过分析网络数据指导机器人行为，真正实现了与机器人的智能对话。”

Vanhoucke进一步阐述：”传统聊天机器人只需信息输入训练，而机器人需要更真实的’实践学习’。以红苹果为例，虽然我们可以向聊天机器人解释什么是苹果，但机器人必须掌握苹果的全部特性，学会区分苹果与红色球体，并掌握采摘技巧。”RT-2的突破性在于它能够自主从网络数据中获取知识，无需人工干预。例如，在处理垃圾处理任务时，RT-2可以自行学习垃圾的定义及处理方式，而无需预先编程。

经过6000多次试验验证，RT-2的表现不仅与前身RT-1相当，在全新场景中的表现更是提升了近一倍（62%对比32%）。这一成果表明，RT-2不仅能够学习知识，还能将所学应用于未知情境，展现了惊人的适应能力。

尽管目前RT-2仍存在局限，只能优化已知任务的执行效率，无法实现从零开始的学习，但这一突破性进展已为机器人技术带来了革命性变化。谷歌表示，RT-2的问世预示着人机协作新时代的来临。

想深入了解RT-2的技术原理？谷歌DeepMind博客提供了详尽的解析，揭示了这一创新AI如何改变机器人控制领域。

2026年02月10日

06:47

谷歌RT-2 AI模型：文本图像转化为机器人动作

最新快讯

2026年02月10日

2025年全国社会物流总额达368.2万亿元同比增长5.1%物流效率持续提升支撑实体经济

Meta扎克伯格发布全新AI模型加速技术前沿发展

安森美半导体四季度营收达15.3亿美元符合预期 2026年首季预测略低于市场预期

OpenAI在美国测试ChatGPT广告功能探索商业化新路径

匡威品牌重组启动全员居家办公重振销售增长

美股加密矿企概念股集体大涨：比特币回升与算力需求推动行情上涨

惠誉确认西门子A+信用评级行业领先稳中有升

Alphabet美元债发行引发千亿美元认购热潮投资者青睐AI企业融资

Databricks完成50亿美元融资估值飙升至1340亿美元

润英联推出全新P6188 0W-20添加剂满足大众50800/50900标准

亿纬锂能签约吉隆坡国际机场光伏储能项目助力马来西亚绿色能源转型

立邦中国携手中电创新共推涂装材料与工业工程战略合作