近期,理想汽车内部传来人事变动消息,其辅助驾驶“端到端”模型负责人夏中谱即将离职。夏中谱在理想汽车的职级高达21级,直接向辅助驾驶研发副总裁郎咸朋汇报工作。
据知情人士透露,夏中谱已悄然退出理想最新的辅助驾驶方案VLA项目组,并在数周内未参与相关业务例会。尽管离职的具体去向尚未明确,但这一变动已在业内引起广泛关注。
夏中谱于2023年加入理想汽车,主要负责辅助驾驶系统的规划控制模型。在此之前,他曾在百度自动驾驶部门担任重要职务。在理想汽车的两年时间里,夏中谱凭借出色的工作表现,职级从P9(对应理想新职级体系19级)迅速升至21级,这样的升职速度在理想内部实属罕见。
然而,夏中谱的离职或与理想汽车辅助驾驶技术路线的变更有关。据知情人士透露,夏中谱对“端到端”路线持优化空间看法,但理想内部已决定押注VLA(Vision-Language-Action,视觉-语言-动作)模型路线。这一决策或许成为双方分道扬镳的导火索。
5月7日,理想汽车CEO李想在AI Talk中详细介绍了VLA模型的优势。他称VLA为一个像人类司机一样工作的司机大模型,并透露理想为此投入了超过预期3倍的训练卡数。这一技术路线的转变,意味着理想汽车在自动驾驶领域迈出了新的一步。
事实上,理想汽车的辅助驾驶技术路线在过去一年中经历了多次切换。从依赖高精地图、基于规则的方案,到“端到端”方案,再到如今的VLA模型路线,理想汽车不断探索和尝试,以期在自动驾驶领域取得更大突破。
“端到端”方案的落地,曾是理想汽车打响名声的关键之战。该方案由特斯拉率先实践落地,相比以往依赖工程师手写的规则方案,“端到端”更加依赖AI模型的自主学习能力。理想汽车的“端到端”方案从立项到全量推送,仅用了不到一年的时间,并因此摆脱了辅助驾驶“落后生”的身份,迅速挤入行业第一梯队。
然而,理想汽车并未将“端到端”视为自动驾驶的终极答案。李想在AI Talk中表示,“端到端”并不完全理解物理世界,更像一种模仿行为。面对复杂场景时,该方案可能会遇到问题。因此,理想汽车决定探索VLA模型路线。
VLA模型最早由谷歌AI公司Deepmind推出,主要用于机器人领域。与ChatGPT、Sora等视觉语言模型(VLM)不同,VLA新增了与物理世界交互的“动作”能力。这意味着VLA不仅能理解周围环境,还能直接输出控制指令,如机器人动作或车辆驾驶决策等。这一特性使得VLA在辅助驾驶领域具有广阔的应用前景。
理想汽车认为,VLA能通过3D和2D视觉的组合,完整地看到物理世界。同时,VLA拥有完整的脑系统,具备语言、CoT(思维链)推理能力。这些特性使得VLA既能看、也能理解并真正执行动作,符合人类的运作方式。因此,理想汽车决定All in VLA大模型,以期在自动驾驶领域取得更大突破。
随着“端到端”旧路线技术负责人夏中谱的离职,理想汽车All in VLA大模型的态度更加坚决。这一决策不仅体现了理想汽车在自动驾驶领域的决心和勇气,也预示着该领域将迎来新的变革和挑战。