Li Auto bat son plein : le modèle VLA peut-il être à la pointe de la nouvelle tendance de la conduite intelligente ?
Mis à jour le : 34-0-0 0:0:0

理想汽车正紧锣密鼓地筹备其i系列纯电动车型的密集上市计划,其中i8将于今年7月亮相。为了支撑这一系列的发布,理想汽车正着手两大战略部署:一是大规模扩建5C超充站网络,二是全力提升智能驾驶技术的先进性。

Selon des personnes proches du dossier, Li Auto a récemment lancé un projet de développement fermé, visant à réaliser l’application du modèle de conduite intelligente VLA (vision-langage-action) au cours du second semestre de cette année. Cette année, la technologie VLA est devenue le cœur de la compétition dans le domaine de la conduite intelligente, et des entreprises telles que Ideal, Geely et Yuanrong Qixing sont en compétition pour devenir les premières entreprises à mettre en œuvre la technologie VLA.

Cependant, la mise en œuvre de la technologie VLA n’est pas une tâche facile, qui nécessite un développement approfondi de modèles et des défis de performances matérielles. À l’heure actuelle, les puces grand public sur le marché sont difficiles à prendre en charge le fonctionnement de la technologie VLA, et les prochaines puces de la série Thor de NVIDIA devraient être la clé pour résoudre ce problème. Li Auto avait initialement prévu de développer une plate-forme informatique de conduite intelligente pour les futurs produits basés sur la puce Thor-U de NVIDIA, mais après avoir connu l’échec de l’arrêt du projet de puce auto-développé « Schumacher », Li Auto a réajusté sa stratégie et a décidé de continuer à utiliser la puce Thor-U MAX de NVIDIA pour le développement, et le modèle VLA devrait également être basé sur cette puce.

智能驾驶技术的竞争日益激烈,不断推动行业第一梯队座次的更迭。理想汽车在2024年凭借端到端+VLM大模型技术崭露头角,去年10月底,理想汽车向超过30万AD MAX版本车辆的车主推送了该技术,随后又全量推送了车位到车位功能,成为行业先行者。尽管端到端+VLM方案受到了高度评价,但它仍属于阶段性成果,无法作为最终解决方案。

Le modèle de conduite intelligente de bout en bout remplace les modules de perception, de planification et de contrôle de la solution de conduite intelligente traditionnelle grâce à des modèles d’IA, de sorte que le système de conduite intelligent peut apprendre le style de conduite des conducteurs humains, afin d’avoir une limite de capacité plus élevée et une vitesse de progression plus rapide. Cependant, l’étape actuelle des grands modèles présente des problèmes tels que des décisions inexplicables et des difficultés à faire face à certains scénarios. Afin de pallier cette lacune, Li Auto a ajouté un modèle VLM sur la base du modèle de bout en bout afin d’améliorer la capacité de compréhension de scénarios complexes. Cependant, les modèles VLM ont une vitesse d’inférence lente et nécessitent beaucoup de ressources de calcul.

Par conséquent, Li Auto a lancé la recherche du modèle VLA de bout en bout, visant à intégrer les modèles de bout en bout et VLM en un seul, afin que le grand modèle multimodal puisse devenir une capacité du grand modèle de conduite intelligente de bout en bout. Cette voie technologique est considérée comme l’orientation future de la conduite intelligente, et pourrait même être proche de la solution finale.

Alors que le FSD V12 de Tesla commence à être testé à petite échelle en Chine, la concurrence dans le domaine de la conduite intelligente devient de plus en plus féroce. De nombreux constructeurs automobiles, dont Ideal, considèrent VLA comme l’orientation future de la conduite intelligente, et des entreprises telles que Geely et Yuanrong Qixing prévoient également de lancer la technologie VLA cette année. Cependant, la mise en œuvre de la technologie VLA est encore confrontée à de nombreux défis, notamment l’intégration profonde des données du modèle et l’amélioration des performances matérielles.

Des entreprises telles que Huawei et Xpeng ont également fait des progrès significatifs dans le domaine de la conduite intelligente. Ils ont adopté un schéma de conduite intelligente segmenté de bout en bout pour résoudre le problème des grands modèles de bout en bout en augmentant la capacité d’interprétabilité et d’inférence des grands modèles. Avec l’itération rapide de la technologie de conduite intelligente des meilleurs acteurs, le rythme de la concurrence continue de s’accélérer et la fenêtre d’opportunité pour les retardataires se réduit progressivement.