小米自动驾驶模型Xiaomi OneVL开源实现VLA与世界模型统一引领行业创新

2026-05-13 21:38:32 互联网 3 次阅读

微新创想：小米今日正式发布并开源Xiaomi OneVL自动驾驶模型。该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一。在具备XLA模型强悍推理能力的基础上，Xiaomi OneVL大幅提升了推理的速度和精度，成为行业内具备开创性的方案。

微新创想：在精度上，Xiaomi OneVL超越了显式CoT；在速度上，它对齐了仅答案预测的潜空间CoT方案。过去，VLA和世界模型是自动驾驶领域两条相对独立的技术路线。VLA专注于理解场景并输出驾驶动作，世界模型则专注于预测未来场景的演变。Xiaomi OneVL通过潜空间推理，首次将两者统一到同一套框架中。

微新创想：在涵盖感知、推理与规划的多个主流基准上，Xiaomi OneVL全面刷新了潜在推理方法的性能上限。在ROADWork、Impromptu、Alpamayo-R1三项基准上均达到SOTA，并在NAVSIM上取得优越性能，PDM-score达到88.84，首次在潜空间推理中超越显式CoT（88.29）。

微新创想：目前，Xiaomi OneVL是唯一在所有基准上超越显式自回归CoT的隐式推理方法。通过挂载MLP回归头变体，其延迟进一步压缩到0.24秒（4.16 Hz），仅为VLA自回归推理的5.4%。这一表现为量产车端的实时部署提供了可行路径。

微新创想：消融实验进一步验证，压缩物理世界的动态信息能够带来显著的性能提升。同时，Xiaomi OneVL能为模型决策提供语言和视觉双维度的可解释性。它既能用文字说明为什么这样开，也能用预测画面展示接下来会发生什么。

2026年05月13日

22:12

小米自动驾驶模型Xiaomi OneVL开源实现VLA与世界模型统一引领行业创新

最新快讯

2026年05月13日

空客黑石联手布局Quantum Systems新一轮融资加速eVTOL发展

佳能全新RF20-50mm F4 L IS USM PZ镜头发布 6月下旬全球上市

佳能EOS R6 V视频相机发布 7K RAW录制国行13999元

腾讯小程序与AI深度融合打造智能体引领服务升级新方向

宝马Z4停产告别24年传奇，4系成最后敞篷轿跑车型

海微科技IPO辅导机构更换为长江证券股东穿透核查确保合规

腾讯2026年加大AI资本支出下半年增幅显著强化算力支撑智能化升级

亚马逊2026年推出AI购物助手Alexa服务美国市场提升智能购物体验

中钨高新金洲公司PCB钻针订单饱满产能持续释放助力市场增长

全球首个天基中微子探测器SNAPPY成功入轨开启太空探索新篇章

宝马女司机车头卡拖把3公里未察觉监控还原惊人一幕

阿里3800亿加码算力中心建设支撑大模型与云服务扩张