在即将到来的7月,理想汽车即将揭开其i8纯电车型的神秘面纱,而这仅仅是理想i系列纯电车密集上市浪潮的开端。为了迎接这一系列新品的到来,理想汽车正紧锣密鼓地推进两大战略举措:一是加速5C超充站的网络布局,二是全力提升智能驾驶技术的先进性。
据内部消息透露,理想汽车已悄然启动了封闭式开发项目,目标直指在今年下半年攻克VLA(视觉-语言-动作)智驾大模型的落地难题。VLA技术被视为智能驾驶领域的核心竞争焦点之一,理想、吉利及元戎启行正激烈角逐,以期成为首个成功落地VLA技术的企业。
然而,VLA技术的落地之路并不平坦。除了模型研发周期长、技术难度大之外,硬件限制也是一道难以逾越的坎。当前市面上的芯片性能普遍无法满足VLA技术的运行需求,而英伟达即将量产的Thor系列芯片则被看作是解决这一难题的关键。理想汽车最初计划基于英伟达Thor-U芯片开发智驾方案,后因自研芯片项目“舒马赫”遭遇流片失败,转而重拾Thor-U MAX作为开发平台。
智能驾驶技术的竞争逐年升级,不断重塑行业格局。2024年,端到端技术成为智能驾驶的新战场,而理想汽车在这一领域取得了显著进展。去年10月,理想汽车率先向超过30万AD MAX版本车辆的车主推送了端到端+VLM大模型,随后又全量推送了车位到车位功能,成为业内首个实现这一功能的车企。这一成果不仅赢得了高度评价,还引发了竞争对手的密切关注。
尽管端到端+VLM方案取得了阶段性成功,但其仍存在局限性,如决策过程不可解释、难以应对少数复杂场景等。为了解决这些问题,理想汽车在端到端模型的基础上引入了VLM(视觉语言)模型。VLM模型以其强大的图像和场景理解能力,提升了智能驾驶系统对复杂场景的应对能力,为端到端模型提供了有力补充。然而,VLM模型的推理速度较慢,且需要占用大量算力资源,这限制了其在实际应用中的效能。
为了解决这一矛盾,理想汽车启动了VLA模型的研究。VLA模型将端到端和VLM两个模型融为一体,实现了多模态大模型与端到端智驾大模型的深度融合。这一创新不仅提升了智能驾驶系统的整体性能,还为智能驾驶技术的未来发展开辟了新的方向。
随着智能驾驶技术的不断演进,行业竞争日益激烈。特斯拉FSD V12在国内的小范围测试更是加剧了这一趋势。包括理想在内的多家车企将VLA视为智能驾驶的未来方向,并加大投入以期率先实现技术突破。吉利汽车、元戎启行等企业也纷纷加入VLA技术的研发行列,共同推动智能驾驶技术的快速发展。
然而,VLA技术的落地仍面临诸多挑战。模型数据的深度融合对研发团队提出了极高的要求,同时车端芯片的性能也成为制约VLA技术发展的关键因素。当前主流的高阶智驾硬件方案普遍采用两颗Orin-X芯片,算力有限,难以满足VLA技术的需求。而英伟达最新一代Thor芯片虽具备更强的算力支持,但尚未广泛应用于量产车型中。
除了VLA赛场外,智能驾驶领域还涌现出其他技术路线。华为、小鹏等企业通过分段式方案推进端到端智驾技术的发展,同样取得了显著进展。随着头部玩家智驾技术水平的快速迭代,行业竞争节奏不断加快,落后者的追赶难度日益加大。