2026年1月29日,宇树科技正式宣布开源其最新研发的视觉-语言-动作(VLA)大模型——UnifoLM-VLA-0,为全球人形机器人领域带来突破性进展。该模型基于先进的Qwen2.5-VL-7B架构,通过约340小时的高质量真机数据持续预训练,实现了卓越的性能优化。UnifoLM-VLA-0创新性地融合了2D/3D空间感知与动力学建模技术,使其能够以单一策略高效完成12类复杂操作任务,涵盖从抓取到精准放置等多样化场景。
在真机验证环节,UnifoLM-VLA-0展现出令人瞩目的强鲁棒性与泛化能力,其空间理解性能显著超越了传统基线模型,为实际应用场景提供了更可靠的解决方案。这一成果不仅验证了模型技术的先进性,也为人形机器人智能化水平的提升奠定了坚实基础。
为了促进技术共享与社区发展,宇树科技已将UnifoLM-VLA-0的完整项目代码及官方主页同步公开,供开发者自由下载与研究。这一开放举措有望加速人形机器人技术的迭代与创新,推动行业迈向更高阶的智能化阶段。
