在人工智能和机器人技术快速发展的今天,视觉 – 语言 – 行动(VLA)模型被广泛认为是构建通用机器人的关键。然而,许多现有的 VLA 模型(如 OpenVLA、RT-2等)在处理复杂的非结构化环境时暴露出一个严重的短板:空间失明。它们依赖于2D RGB 图像作为视觉输入,导致模型在三维空间中的表现受限,难以准确判断物体的深度和位置。

image.png

为了解决这一问题,原力灵机的研究团队推出了一种全新的 VLA 框架 ——GeoVLA。该框架在保持现有视觉 – 语言模型(VLM)强大预训练能力的同时,采用了创新的双流架构。具体来说,GeoVLA 引入了专用的点云嵌入网络(PEN)和空间感知动作专家(3DAE),使机器人具备真正的三维几何感知能力。这一设计不仅在仿真环境中取得了领先的性能,更在真实世界的各种鲁棒性测试中表现出色。

GeoVLA 的核心逻辑在于将任务进行解耦:让 VLM 负责 “看懂是什么”,让点云网络负责 “看清在哪里”。这个全新的端到端框架包含了三个关键组件的协同工作,分别是语义理解流、几何感知流和动作生成流。这种方法使得模型能够更精准地进行任务。

image.png

在一系列实验中,GeoVLA 展现出了明显的优势。在 LIBERO 基准测试中,GeoVLA 的成功率高达97.7%,超越了之前的 SOTA 模型。此外,在 ManiSkill2等更加复杂的物理仿真测试中,GeoVLA 的表现也相当出色,尤其在处理复杂物体和视角变化时,保持了较高的成功率。

更为令人瞩目的是,GeoVLA 在分布外场景中的鲁棒性,证明了其在应对各种不确定性和变化条件下的强大适应能力。这一突破将为未来的机器人应用带来新的可能性,推动智能机器人技术向更高水平迈进。

项目地址:https://linsun449.github.io/GeoVLA/

最新快讯

2025年12月25日

17:24
最近播出的纪录片《寻真之地》中,向佐向丁真哭诉自己在娱乐圈的成长经历,坦言"从小在娱乐圈长大,再复杂的人都见过,我觉得他们很恐怖,人是很恐怖的。"丁真则回应道"如果扛不住的话,那你别混这个圈子了。"理塘放牛人"点拨"富二代的这一幕迅速成为互联网热议的名场面。当大众还停留在对向佐"搞抽象"的印象时,他新开设的@向佐奢品 账号却已悄然实现月销过亿的成绩。据卡思数...
17:24
小红书战略转型:从图文种草到中长视频的全面升级 随着图文种草的增长红利逐渐消退,小红书终于亮出了它的全新战略底牌。数月前,一场深刻的组织架构调整在小红书内部悄然完成,标志着平台从垂类运营向中长视频和头部创作者战略的全面倾斜。这场变革不仅是简单的部门合并,更是小红书发展路径的一次重大转折——它正试图告别曾经赖以起家的垂类精细化运营模式,将所有资源集中火力打造中...
16:44
2025年12月25日,备受瞩目的蜜雪冰城杭州首家旗舰店正式在西溪银泰城拉开试营业帷幕。这家位于杭州西溪银泰城的旗舰店采用上下双层设计,整体面积高达700平方米,是普通门店规模的数倍,彰显出品牌对浙江市场的重视与投入。据悉,作为蜜雪冰城进军浙江市场的先锋站,该店将于12月31日正式开业,为杭州消费者带来全新的品牌体验。此次旗舰店的落地,不仅标志着蜜雪冰城在浙...
16:44
任天堂官方正式宣布,日本地区eShop即将开启新年限时特惠活动,活动时间定于2023年12月26日至2024年1月8日,为期近一个月的狂欢盛宴即将到来。本次促销涵盖众多备受瞩目的游戏大作,折扣力度惊人,诚意满满。 人气大作《皮克敏4》将享受高达8折的震撼优惠,让玩家以更亲民的价格体验这款备受好评的横版冒险游戏。运动休闲游戏《Nintendo Switch S...
16:44
2025年12月25日,东安动力传来振奋人心的消息,其自主研发的新一代混动专用发动机M15NTH在公司试验室中顺利实现一次性点火成功,为新能源汽车发展注入强劲动力。这款1.5L高效增压平台发动机,凝聚了多项前沿技术突破,包括深度米勒循环优化、全可变机油泵智能调控以及电子水泵精准驱动等创新设计,这些技术的融合应用将显著提升发动机的热效率与燃油经济性,为用户带来...
16:44
2026年淘宝年货狂欢季招商规则正式发布 活动亮点抢先看 备受瞩目的2026年淘宝年货狂欢季招商规则于12月25日正式公布。本次活动将创新性地采用“官方立减”玩法,为商家和消费者带来更加丰厚的购物体验。据悉,商品报名通道将于12月24日18时准时开启,持续至1月13日23时59分,让商家有充足时间准备参与。而整个售卖周期则定在2026年1月4日零点至2月11...
16:44
2025年12月24日,爱尔眼科(SZ300015)正式宣布完成一项战略性股权收购,以自有资金9.63亿元人民币成功收购亳州爱尔、连云港爱尔等39家医疗机构的股权。这一举措不仅彰显了公司对眼科医疗事业持续投入的决心,更体现了其深耕区域市场的长远规划。 此次被收购的39家机构在2024年合计实现收入6.86亿元,尽管面临净利润亏损5899.51万元的挑战,但2...
16:44
12月24日,广州新济医药股份有限公司向港交所主板递交上市申请,国泰海通为独家保荐人。公司成立于2007年,是一家处于临床阶段的创新驱动型医药企业,专注于高端制剂新药研发,拥有可溶性微针和鼻腔吸入两大技术平台。其核心产品包括用于术前镇静的微针贴剂及治疗帕金森病“关”期发作的鼻腔吸入制剂,均已进入II期临床试验。2023年至2025年上半年,公司收入分别为5...
16:44
2025年12月25日,杭州云深处科技完成数亿元Pre-IPO轮融资,由国家人工智能产业基金领投,某互联网大厂跟投。该公司于12月23日启动IPO辅导,辅导机构为中信建投证券。云深处科技成立于2017年,专注人形与四足机器人研发生产,应用于电力巡检、应急救援等领域,创始团队源自浙江大学。朱秋国为公司实控人,持股32.60%。这是继群核科技、宇树科技后,“杭...
16:44
2025年12月30日上午9时,洪九果品(06689.HK)将正式失去其H股上市地位。这一决定源于该公司未能按期复牌的困境。自2024年3月20日停牌以来,洪九果品始终未能满足港交所的复牌要求,最终导致其股价被终止上市。港交所于10月3日作出摘牌决定,随后上市复核委员会维持了这一决议。 洪九果品于2022年9月5日以每股40港元的发行价成功上市,当时募集资金...
16:44
2024年12月24日,上海证券交易所正式披露,视涯科技股份有限公司(以下简称"视涯科技")首发申请已符合发行条件,标志着这家专注于硅基OLED微显示屏研发与生产的高新技术企业即将叩响资本市场大门。作为行业内的技术先锋,视涯科技凭借其领先的微显示技术,成功赢得了字节跳动、雷鸟科技、联想集团等知名企业的青睐,成为其核心供应商之一。 尽管在2022年至2024年...
16:44
2024年12月24日,中电科思仪科技股份有限公司正式获得深圳证券交易所创业板上市申请的受理通知,其保荐机构为国泰海通证券。这家在电子测量仪器领域深耕多年的企业,此前曾于2022年尝试申报科创板上市,但最终主动撤回申请。作为国内电子测量仪器行业的领军者,思仪科技凭借其全面的产品线和完善的技术布局,在行业内树立了标杆地位,其产品门类之全、频谱覆盖之宽,在国内尚...