微新创想(idea2003.com)7月29日 消息:谷歌近日发布了一款名为Robotic Transformer(RT-2)的人工智能学习模型,旨在显著提升其机器人产品的智能化水平。RT-2是谷歌在视觉-语言-动作(VLA)模型领域的重要升级,该模型的核心功能在于帮助机器人更精准地识别视觉与语言信息,从而高效理解人类指令,并智能推断出完成特定任务所需的最佳物体选择。

在测试中,谷歌研究人员在模拟的厨房办公室环境中,让RT-2操控机械臂完成了一系列复杂任务。例如,要求机器人判断什么是一把理想的简易锤子——尽管实际选择的是一块石头,但机器人展现了出色的推理能力;又如为疲惫的人选择合适的饮料(红牛),并将可乐罐精准移动到泰勒·斯威夫特的照片上。值得注意的是,该机器人还展现出对流行文化的理解,被研究人员戏称为”Swiftie”,这一特性无疑为未来人机交互增添了更多趣味性和实用性。

谷歌在相关论文中详细阐述了RT-2的技术架构:该模型通过整合网络数据与海量机器人实践数据训练而成,充分吸收了谷歌自家的Bard等大型语言模型的先进成果,并将自然语言处理能力与机器人物理操作数据(如关节运动参数)无缝融合。更令人惊喜的是,RT-2不仅精通英语指令,还能理解多种语言的指令,真正实现了跨文化智能交互。

长期以来,机器人领域的研究重点始终是如何提升机器人的环境适应能力。The Verge科技评论家詹姆斯·文森特指出,现实世界环境极其复杂多变,人类往往能通过少量直观指令完成机器人需要大量繁琐指令才能完成的简单任务。以清理溢出饮料为例,人类会本能地拿起杯子、寻找清洁工具、处理垃圾,并形成未来避免类似状况的经验积累。传统机器人训练需要研究人员逐条编程,过程耗时且效率低下。而RT-2等VLA模型的问世,使机器人能够基于更丰富的信息进行自主推理,大幅简化了人机协作的复杂度。

回顾谷歌在智能机器人领域的探索历程,去年该公司首次尝试将PaLM大型语言模型应用于机器人技术,推出了名为PaLM-SayCan的混合系统,标志着谷歌正式进军智能机器人市场。尽管RT-2展现了令人瞩目的进步,但谷歌的新一代机器人产品仍存在改进空间。《纽约时报》的现场评测发现,该机器人存在苏打水口味识别错误、水果颜色分类失误等问题,这些细节上的不足也反映了当前人工智能在真实场景应用中的典型挑战。随着技术的持续迭代,我们有理由期待未来机器人将更加智能、更加人性化。

最新快讯

2025年12月16日

09:14
微新创想12月15日重磅消息,长期以来手机电池容量始终徘徊在5000-6000mAh的瓶颈期,用户中度使用仅能勉强支撑一天,充电宝也因此成为许多人出门在外的必备装备。然而进入2025年,手机厂商们纷纷发力,这一行业困局被彻底打破。荣耀率先在自家的荣耀Power系列上实现了8000mAh的突破,将手机电池容量带入全新的8000mAh时代,为用户带来了前所未有的...
09:14
日本航天企业SPACE ONE即将于2025年2月25日迎来其小型火箭“KAIROS”3号机的发射任务。这一备受瞩目的航天事件定于当天上午11时准时启程,发射地点选在位于和歌山县串本町的“Space Port纪伊”发射场。此次发射不仅标志着SPACE ONE的持续努力,也承载着业界对小型卫星发射技术的热切期待。 作为一家成立于2018年的新兴航天企业,SPA...
09:14
2025年12月15日,全球电脑市场迎来重大消息,台湾两大电脑巨头宏碁与华硕正式宣布将全面上调PC产品价格。这一决定背后,是存储芯片持续缺货引发的巨大成本压力。作为全球笔记本电脑市场的领军企业,宏碁与华硕均面临供应链困境,不得不通过调整售价来缓解财务压力。 此次价格调整的核心原因在于全球存储芯片供应的严重短缺。宏碁董事长陈俊圣在内部会议上明确指出,由于上游原...
09:14
2025年12月16日,华泰证券发布了一份深度研报,揭示了全固态电池技术正迎来历史性发展机遇。报告指出,凭借其卓越的安全性表现和远超传统锂电池的能量密度优势,全固态电池正加速从实验室走向产业化应用。这一技术突破不仅将重塑新能源汽车和储能产业的格局,更标志着全球能源存储技术迈入全新纪元。 当前,全固态电池产业的发展重心已从基础材料研究转向生产工程领域。在这一关...
09:14
近日,OpenAI 首席传播官汉娜・王正式宣布,她将于明年一月告别这家科技巨头,开启人生新篇章。这一消息由 OpenAI 官方发言人凯拉・伍德确认,并引发业界广泛关注。汉娜・王在任期间,以其卓越的沟通才能为 OpenAI 塑造了积极正面的公众形象,显著提升了公司的品牌影响力与行业声誉。 OpenAI 首席执行官山姆・阿尔特曼与应用部门首席执行官菲杰・西莫联合...
09:14
Chai Discovery 作为一家专注于药物研发领域的生物科技初创企业,近日成功斩获1.3亿美元B轮融资,公司估值飙升至令人瞩目的13亿美元。此次融资由知名风投机构General Catalyst和Oak HC/FT联合领投,Menlo Ventures、OpenAI、Dimension、Thrive Capital、Neo、Yosemite Ventu...
09:14
OpenAI于12月15日正式官宣,任命前谷歌企业发展主管Albert Lee担任公司企业发展副总裁一职。Lee将于12月16日正式履新,直接向首席财务官Sarah Friar汇报工作,其核心职责将聚焦于推动OpenAI在战略合作、投资布局及商业生态拓展等关键领域实现突破性进展。 Albert Lee在谷歌任职期间长期主导企业级合作与战略投资事务,积累了丰富...
09:14
OpenAI 在其十周年庆典之际发布了备受瞩目的 GPT-5.2 模型,这一全新系列在专业领域引发了巨大反响。根据官方公布的数据,GPT-5.2 在多项权威基准测试中取得了令人瞩目的成绩,甚至在某些专业领域超越了人类专家的表现,成为迄今为止在专业应用中最出色的 AI 模型之一。OpenAI 详细介绍称,GPT-5.2 在多个技术领域实现了突破性进展。以 GD...
09:14
人工智能领域的领军企业OpenAI近日宣布了一项重要的人事任命,前谷歌高管Albert Lee将出任企业发展业务负责人一职。Lee在谷歌云和Google DeepMind的发展业务中积累了丰富的经验,并主导了多项引人注目的收购交易,其中包括今年3月以320亿美元收购云安全初创公司Wiz的里程碑式交易。这一战略任命标志着OpenAI将在战略投资和并购领域加速布...
09:14
知识共享组织(Creative Commons,CC)近期对"付费爬取"(Pay-for-Crawl)技术表达了审慎的支持态度。这一创新系统通过自动支付报酬的方式,允许机器(如人工智能网络爬虫)在访问网站内容时进行数据采集。CC今年早些时候推出的"开放人工智能生态系统"框架,旨在为控制数据的公司与利用数据进行训练的AI提供商之间,搭建共享数据集的法律和技术桥...
09:14
迪士尼首席执行官鲍勃·艾格近日向CNBC透露了公司与OpenAI签署的三年期授权合作协议的细节:尽管协议为期三年,但针对迪士尼旗下核心IP的独家授权期限仅为一年。这一合作于上周正式宣布,迪士尼将漫威、皮克斯、《星球大战》等200多个标志性角色的海量内容授权给OpenAI的Sora视频生成器使用。这意味着OpenAI在一年内将成为唯一获得合法授权的AI公司,允...
09:14
路透社最新消息显示,英伟达于本周一正式宣布完成对人工智能软件公司 SchedMD 的战略性收购。这一举措标志着英伟达在开源技术领域的又一重要布局,进一步巩固了其在全球 AI 生态系统中的领导地位。作为全球知名的图形处理器巨头,英伟达不仅以其卓越的高速芯片闻名于世,更在 AI 领域展现出惊人的战略眼光,积极构建完善的 AI 技术生态。 英伟达通过开源模式,向业...