
银河通用近日携手北京大学、阿德莱德大学与浙江大学等顶尖科研团队,共同宣布全球首发创新性导航基座大模型——NavFoM(Navigation Foundation Model)。这一突破性成果致力于将多元机器人导航任务整合于统一框架,涵盖视觉与语言导航、目标导向导航、视觉追踪及自动驾驶等广泛应用场景,为机器人技术发展注入全新活力。

NavFoM的核心优势在于其卓越的全场景适应能力。无论是复杂多变的室内环境还是广阔无垠的室外场景,该模型均能在未预知环境中实现零样本运行,彻底摆脱传统建图与数据采集的繁琐流程。这一创新特性极大降低了技术应用门槛,用户可轻松将技术部署于多样化场景,显著提升作业效率。此外,NavFoM还具备强大的多任务处理能力,通过自然语言指令即可完成目标跟随、自主导航等复杂任务,真正实现跨平台无缝适配。从灵活机动的机器狗到高空飞行的无人机,从灵巧的轮式人形机器人到大型商用汽车,各类尺寸与形态的机器人均可在该框架下高效运行,展现出惊人的通用性与扩展性。
在技术架构层面,NavFoM实现了两项关键性创新突破。首先是革命性的TVI Tokens(Temporal-Viewpoint-Indexed Tokens)机制,通过引入时间维度与视角索引,赋予模型精准理解时空关系的能力;其次是创新的BATS策略(Budget-Aware Token Sampling),在严苛算力限制下依然能保持卓越性能表现。这两项技术突破为模型在复杂动态环境中的稳定运行提供了坚实保障。

NavFoM的训练数据规模同样令人瞩目。团队构建了包含约八百万条跨任务、跨本体的导航数据集,以及四百万条开放问答数据,总训练量是既往同类工作的两倍。如此海量的高质量数据支撑,使模型在语言与空间语义理解方面达到全新高度,为机器人智能决策提供更强大的认知基础。
NavFoM的问世标志着机器人导航领域迈入全新发展阶段。该模型不仅为开发者提供了强大的技术底座,更为后续定制化应用模型的研发开辟了广阔空间。通过在此基础上进行针对性训练,可快速构建满足特定场景需求的专用导航系统,推动机器人技术在工业、物流、服务等领域的深度应用。这一突破性成果必将引领机器人导航技术迈向更高水平,为智能机器人产业的蓬勃发展注入强劲动力。
