7月29日重磅消息,在昨晚理想汽车i8上市发布会现场,自动驾驶技术负责人郎咸朋带来了关于理想自研VLA司机大模型的深度解读。这款先进的视觉语言行动模型(Vision-Language-Action Model)标志着理想汽车在智能驾驶领域迈出了革命性的一步。通过这一创新技术,理想汽车致力于让AI真正化身”数字司机”,成为交通出行领域的专业生产力工具,其目标直指实现堪比人类司机的驾驶体验,甚至大胆喊出了”购车即送专属司机”的震撼口号。
VLA模型的研发历程经历了三个关键进化阶段。第一阶段始于2021年,通过自研的规则算法与高精地图技术实现了依赖规则算法的辅助驾驶系统,这一阶段的技术水平可类比为昆虫的动物智能。第二阶段进入2023年,理想汽车开始研究端到端的VLM辅助驾驶技术,并于2024年正式向用户推送,这一阶段的技术水平已接近哺乳动物的智能层次。而第三阶段VLA模型则开启了迈向”人类智能”的新纪元,该模型能够通过3D与2D视觉信息的完美融合,全面感知物理世界,同时具备完整的脑系统架构,拥有语言理解与思维链推理能力,真正实现了”所见即所行”的智能驾驶境界。
VLA司机大模型以”司机智能体”(Driver Agent)的创新产品形态呈现。用户可以通过自然语言与司机智能体进行流畅交互,其中简单通用的短指令将由端侧VLA模型直接处理,而复杂指令则先通过云端VL基础模型进行深度解析,再交由VLA模型执行。理想汽车凭借自有的编译团队,成功研发了底层推理引擎,使英伟达Orin-X芯片能够通过INT4量化技术高效运行VLM模型。更值得一提的是,依托在芯片设计、控制器开发以及自研汽车操作系统等方面的综合技术实力,理想汽车实现了双Orin-X芯片与Thor-U芯片在同等规模VLA司机大模型上的并行运行。
正是基于这一突破性技术,所有理想汽车Max版车型均可升级到VLA司机大模型,即便是2022款理想L9 Max也无需例外。此外,郎咸朋还透露了更令人期待的升级计划:搭载了地平线J6M智驾芯片的理想汽车Pro车型(包括焕新版理想L系和i8 Pro),将在今年年底迎来城市NOA功能的全面升级,为用户带来更加智能化的出行体验。