北京团队突破全球首个人形机器人3D视觉系统 多传感器融合技术领跑世界

人形机器人正从科幻作品中的想象逐渐变为现实,而视觉感知能力始终是制约其发展的核心瓶颈。近日,北京人形机器人创新中心重磅推出名为”Humanoid Occupancy”的突破性视觉感知系统,该技术被业界誉为人形机器人环境理解能力的重大飞跃。长期以来,机器人感知系统面临着诸多挑战。现有的感知技术大多局限于单一或特定场景,当面对复杂多变的真实环境时,往往表现不尽如人意。更为严峻的是,许多系统无法有效整合来自不同传感器的数据,导致大量有价值的环境信息被闲置,甚至出现感知盲区,这直接影响了机器人的移动、导航和操作精度。

“Humanoid Occupancy”系统的核心创新在于引入了语义占用表征技术。该技术能够对三维空间进行精细化建模,通过体素单元直接描述每个空间位置的占用状态和物体类别信息。与传统的鸟瞰图表征方式相比,这种方法能够提供更加立体和全面的环境信息。该系统展现出三大显著技术优势。在空间信息处理方面,系统实现了对三维环境的完整编码,每个空间单元都能被准确识别和分类。在数据融合层面,语义占用表征天然支持多模态传感器协同工作,能够将RGB摄像头、深度传感器、激光雷达等设备采集的数据进行统一处理和分析。在系统架构上,研发团队通过优化传感器配置、构建专门的全景占用感知数据集,并设计了高效的多模态融合网络,确保了感知的准确性和响应速度。

北京团队突破全球首个人形机器人3D视觉系统 多传感器融合技术领跑世界插图1

项目团队还创新性地解决了数据稀缺这一行业痛点。他们构建了一个涵盖家庭生活、工业生产等多种应用场景的大规模数据集,并提供了详尽的语义标注信息。这个数据集不仅为当前系统提供了坚实的训练基础,也为整个人形机器人研究领域提供了宝贵的资源支持。业内专家指出,”Humanoid Occupancy”系统的问世标志着人形机器人感知技术进入了新的发展阶段。随着这项技术的成熟和推广,人形机器人有望在家庭服务、工业制造、医疗护理等领域发挥更大作用,真正实现与人类的和谐共存。从技术发展轨迹来看,这一突破不仅解决了当前人形机器人面临的感知难题,更为未来智能机器人的大规模应用奠定了坚实基础。随着相关技术的不断完善,我们或许很快就能见证人形机器人真正走进千家万户的历史时刻。论文地址:https://arxiv.org/pdf/2507.20217

最新快讯

2026年03月04日

14:11
2026年3月4日,美国医用同位素开发商SHINE Medical Technologies宣布完成2.4亿美元C轮融资。本轮融资由Oaktree Capital、Deerfield Management、Pelican Energy Partners、住友商事及富达投资等机构联合参与。公司总部位于美国威斯康星州,专注于医疗示踪剂及放射性同位素的研发、生产...
14:11
2026年3月4日,科技媒体Windows Latest实测指出,Windows 11 IoT Enterprise LTSC版本是当前最纯净的Windows 11装机选择。该版本面向企业及嵌入式设备,剔除Copilot、小组件、广告及预装应用,仅保留基础工具,系统占用仅16.3GB。安装需通过微软官网下载约4.71GB ISO镜像,支持x64架构,硬件要...
14:11
近日,上海神络医疗科技有限公司完成C轮融资,由君联资本投资。该公司专注于有源神经植入式医疗器械研发,主攻脊髓神经刺激器(SCS)和短期植入式外周神经电刺激(PNS)两类三类医疗器械,用于治疗慢性疼痛、癫痫及心衰等疾病。其技术基于神经调控创新平台,目前产品处于研发与注册申报阶段。本轮融资将加速临床试验推进及产业化布局。
14:11
2026年3月,人工智能与光纤听觉技术驱动的工业服务企业云智矿安完成A+轮融资,投资方为瀚元投资。公司总部位于中国,聚焦广域设施智能运维,已研发出光纤听觉核心算法,构建‘1+N’智能运维产品体系。其国内首发的工业皮带机智能运维系统,已落地煤矿、港口、钢厂、电厂等多行业,并获海内外龙头企业采用。本轮融资将用于技术研发升级与全球化订阅式服务拓展。
14:11
3月4日,工业三维视觉检测企业板石智能宣布完成B轮融资,由建信股权、当看同创基金和元禾控股联合投资。公司总部位于中国,专注于工业自动化生产与科学实验领域的高精度三维检测设备及整体解决方案。其技术覆盖工业成像、光谱分析、质量检测及机器人视觉引导等场景。本轮融资将用于技术研发升级、核心部件自研及市场拓展。板石智能已服务多家制造业头部客户,持续强化在精密检测赛道...
14:11
近日,河南一位妈妈在网络上分享了一段自己独特的清洗羽绒服的方法,引发了网友们的广泛关注和热议。视频中,这位妈妈让孩子穿着羽绒服站在浴室里,就像平时洗澡一样,先用清水将全身冲洗一遍,随后用搓澡巾蘸上洗涤剂,仔细地搓洗羽绒服的每一处,最后再用清水冲洗干净。这位妈妈表示,这样清洗羽绒服不仅蓬松干净,而且不会结块,省去了传统清洗方式的许...
14:11
微新创想3月4日消息,3月8日妇女节将至,各大电商平台陆续启动节日促销活动。为彰显节日氛围,淘宝APP将图标换成了粉色背景色,并配上白色3.8焕新周”的字体样式。没想到,这一波操作,招来了网友吐槽。有人发出灵魂拷问”,淘宝,你怎么褪色了?”有网友透露,淘宝图标由高饱和橙色变为浅粉色,视觉上呈现褪色感,是官方为三八妇女节推出的临时...
14:11
微新创想3月4日消息,今日,vivo官微宣布,vivo {tag_keyurl_6} 6 Pro在MWC 2026上全球首秀。据介绍,该平板行业首发4K原彩屏,搭载第五代骁龙8至尊版旗舰芯片,号称4K性能平板时代”。据了解,vivo Pad 6 Pro屏幕尺寸为13.2英寸,前置800万像素镜头,后摄为1300万像素,内置130...
14:11
微新创想:近日,一名来自墨西哥的独立开发者在 Reddit 社区发帖求助,引发了全球开发者对云服务计费机制的激烈讨论。该开发者所在的团队是一个仅有三名成员的微型创业团队,因一次操作失误,不慎将 Google Gemini 的 API 密钥泄露到了公开网络。这一疏忽迅速导致了严重后果。 灾难随即降临。在密钥被黑产脚本抓取后的短短 48 小时内,该账户产生了高达...
14:11
微新创想:对开发者而言,API 密钥如同银行卡密码,一旦泄露后果不堪设想。近日,一名来自墨西哥的三人小团队开发者在社交平台 Reddit 发帖求助,称其因操作失误不慎将 Google Gemini 的 API 密钥泄露至公网。在短短 48 小时内,该团队收到了高达 8.2 万美元(约合 59 万人民币)的巨额账单。该开发者表示,其团队平时每月的 Gemini...
14:11
微新创想:微软正加速推进其人工智能战略,全面转向“AI 优先”的运营模式。在这一背景下,下一代操作系统 Windows 12 的开发工作已进入关键阶段,其代号“Hudson Valley Next”也逐渐浮出水面。根据多家技术媒体和供应链消息透露,Windows 12 最快将在 2026 年晚些时候正式发布,这一时间节点恰好与 Windows 10 停止支持...
13:40
微新创想:近日,一位来自山东潍坊的妈妈在社交平台上分享了一段令人惊叹的视频,视频中她的儿子用普通的筷子自制了一架“无人机”,并且成功让它飞了起来,这一创意举动迅速在网络上引起了广泛关注。视频中,这位小男孩巧妙地将两只筷子交叉固定,然后在四个端点上分别安装了螺旋桨。经过一番调试和操作,这架看似简陋却充满创意的“筷子无人机”竟然真的离开了地面,在空中悬停了数秒,...