微新创想(idea2003.com)7月29日 消息:谷歌近日发布了一款名为Robotic Transformer(RT-2)的人工智能学习模型,旨在显著提升其机器人产品的智能化水平。RT-2是谷歌在视觉-语言-动作(VLA)模型领域的重要升级,该模型的核心功能在于帮助机器人更精准地识别视觉与语言信息,从而高效理解人类指令,并智能推断出完成特定任务所需的最佳物体选择。

在测试中,谷歌研究人员在模拟的厨房办公室环境中,让RT-2操控机械臂完成了一系列复杂任务。例如,要求机器人判断什么是一把理想的简易锤子——尽管实际选择的是一块石头,但机器人展现了出色的推理能力;又如为疲惫的人选择合适的饮料(红牛),并将可乐罐精准移动到泰勒·斯威夫特的照片上。值得注意的是,该机器人还展现出对流行文化的理解,被研究人员戏称为”Swiftie”,这一特性无疑为未来人机交互增添了更多趣味性和实用性。

谷歌在相关论文中详细阐述了RT-2的技术架构:该模型通过整合网络数据与海量机器人实践数据训练而成,充分吸收了谷歌自家的Bard等大型语言模型的先进成果,并将自然语言处理能力与机器人物理操作数据(如关节运动参数)无缝融合。更令人惊喜的是,RT-2不仅精通英语指令,还能理解多种语言的指令,真正实现了跨文化智能交互。

长期以来,机器人领域的研究重点始终是如何提升机器人的环境适应能力。The Verge科技评论家詹姆斯·文森特指出,现实世界环境极其复杂多变,人类往往能通过少量直观指令完成机器人需要大量繁琐指令才能完成的简单任务。以清理溢出饮料为例,人类会本能地拿起杯子、寻找清洁工具、处理垃圾,并形成未来避免类似状况的经验积累。传统机器人训练需要研究人员逐条编程,过程耗时且效率低下。而RT-2等VLA模型的问世,使机器人能够基于更丰富的信息进行自主推理,大幅简化了人机协作的复杂度。

回顾谷歌在智能机器人领域的探索历程,去年该公司首次尝试将PaLM大型语言模型应用于机器人技术,推出了名为PaLM-SayCan的混合系统,标志着谷歌正式进军智能机器人市场。尽管RT-2展现了令人瞩目的进步,但谷歌的新一代机器人产品仍存在改进空间。《纽约时报》的现场评测发现,该机器人存在苏打水口味识别错误、水果颜色分类失误等问题,这些细节上的不足也反映了当前人工智能在真实场景应用中的典型挑战。随着技术的持续迭代,我们有理由期待未来机器人将更加智能、更加人性化。

最新快讯

2025年10月29日

05:24
2025年10月28日,美国股市上演了一场鲜明的板块分化行情。在整体市场波动中,科技板块异军突起,成为当日表现最亮眼的板块。全球科技股指数ETF逆势上涨1.38%,展现出强劲的增长动力。细分领域同样表现不俗,科技行业ETF上涨0.99%,半导体ETF更是录得0.88%的涨幅,显示出市场对科技股的持续看好。特别是在标普500指数中,信息技术板块涨幅高达1.64...
05:24
诺基亚首席执行官Patrik Hotard近日公开强调,公司与全球知名科技巨头英伟达的战略合作将共同开启无线通信技术的创新纪元。双方将强强联手,聚焦于人工智能驱动的无线网络解决方案研发,致力于加速6G技术的商业化进程。根据规划,这项具有里程碑意义的合作产品预计在2027年实现全球范围内的全面商业化部署,而首批客户的试点测试计划将于2026年初正式启动。 此次...
05:24
2025年10月29日,全球知名食品饮料公司亿滋国际正式发布最新业绩指引,宣布将全年有机净营收增长预期从原先的5%下调至约4%。这一调整主要受到两大因素影响:部分核心市场的消费需求出现放缓迹象,以及全球汇率波动带来的不利冲击。尽管面临外部环境挑战,亿滋国际强调其核心品牌在亚太、欧洲等多个关键区域依然展现出强劲的市场韧性,持续保持稳健增长态势。为应对当前复杂的...
04:52
苹果公司于今日正式向全球iPhone和iPad用户推送了iOS/iPadOS 18.7.2 RC(Release Candidate)版本更新,其内部版本号为22H123。此次更新距离上一个测试版本发布已过去了整整49天,充分展现了苹果在软件迭代方面的严谨与高效。对于广大果粉而言,这是一个不容错过的系统优化机会。 想要升级至最新测试版系统的用户,主要有两种途...
04:52
苹果公司于今日正式向iPhone和iPad用户推送了备受期待的iOS/iPadOS 26.1 RC测试版更新,内部版本号为23B82。此次更新距离上一轮测试版发布仅相隔8天,充分展现了苹果公司快速迭代和精益求精的开发节奏。用户可以通过两种途径参与本次系统升级体验:对于公开测试版,用户需要提前注册Apple Beta版软件计划,并在系统设置中手动开启Beta版...
04:52
苹果公司今日正式向Mac用户发布了macOS 26.1 RC更新,其内部版本号为25B77。值得注意的是,距离上一轮Beta/RC版本发布仅过去了短短8天,这一密集的更新节奏充分展现了系统优化已进入关键冲刺阶段。从历史发布记录来看,macOS 26系列自今年6月启动测试以来,已经经历了多轮次的迭代与调试,而近期的工作重点则明显转向了系统稳定性的全面提升。 本...
04:52
苹果公司近日向Vision Pro用户正式发布visionOS 26.1 RC版本更新,内部版本号为23N48。此次更新仅距离上一个测试版本发布8天,彰显了苹果在空间计算系统开发上的惊人速度。根据官方更新日志,由于全球服务器节点配置存在差异,部分地区用户可能会遇到更新时间延迟,但通常不会超过半小时。从版本发布历史来看,visionOS 26自今年6月启动测试...
04:52
苹果公司今日正式向全球Apple Watch用户推送了备受期待的watchOS 26.1 RC版本(内部版本号为23S36),这一重要更新标志着该操作系统距离最终正式发布仅一步之遥。值得注意的是,此次RC版本的发布距离上一轮Beta/RC版本仅相隔8天,这一紧凑的更新周期清晰地反映出苹果在系统开发方面的节奏已趋于稳定,预示着后续版本迭代将更加高效有序。 回顾...
04:21
2025年10月29日,在华盛顿GTC全球科技大会上,英伟达CEO黄仁勋发表了掷地有声的演讲,有力驳斥了当时甚嚣尘上的AI泡沫论。他不仅描绘了英伟达未来的宏伟蓝图,更透露了公司最新研发的Blackwell芯片及Rubin模型将在未来五个季度内创造高达5000亿美元收入的惊人目标。 大会上,英伟达展示了与优步、Palantir和CrowdStrike等知名...
03:44
2025年10月29日,微软正式宣布将在Azure云平台率先推出搭载NVIDIA RTX Pro 6000 Blackwell服务器版GPU的尖端计算服务。这一创新举措专为提升人工智能与高性能计算能力而设计,将全面面向企业客户开放使用。该服务的推出不仅彰显了微软与NVIDIA在AI基础设施领域的深度战略合作,更预示着Azure将在全球云计算市场迎来新的竞争优...
03:44
2025年10月29日,科技巨头英伟达重磅发布了一款革命性AI模型,专为加速自动化工厂建设而设计。这款尖端模型于当日全球同步上线,将广泛应用于制造业的各个领域。英伟达通过深度融合其强大的GPU计算能力与前沿深度学习技术,为工业自动化领域提供了前所未有的高效解决方案。 此次推出的AI模型具备三大核心优势:首先能够精准优化机器人控制算法,显著提升作业精度与效...
03:44
2025年10月29日,备受瞩目的医疗行业领军企业Medline正式向美国证券交易委员会递交了其备受期待的首次公开募股(IPO)申请。这家总部位于伊利诺伊州的医疗供应商,作为北美地区规模最大的私营医疗用品制造商与分销商之一,此次IPO计划在声名显赫的纽约证券交易所或纳斯达克挂牌交易,预计将筹集高达10亿美元的资金。此次发行备受市场瞩目,摩根士丹利、高盛等顶级...