Publié sur éduscol STI (https://sti.eduscol.education.fr)

Accueil > Apprentissage par renforcement de la conduite d’un véhicule sur AirSim

publié le 19 Juil 2022 par Hélène HORSIN MOLINARO [1]

Conduite sur le circuit de test par un modèle pré-entraîné fourni [2]
Structure du problème et interaction des différents outils logiciels utilisés [3]
Espace des actions utilisé pour la résolution de notre problème [4]
Définition du modèle et de l’algorithme d’apprentissage [5]
Circuit d’entraînement [6]
Circuit de test [7]
Exemple d’une trajectoire obtenue sur le circuit de test pour un agent entrainé pendant environ 2h [8]

Contenu principal

Description

Apprentissage par renforcement de la conduite d’un véhicule sur AirSim

L’émergence des transports autonomes obligent le développement de nouvelles méthodes de conduite. Plusieurs méthodes d’intelligence artificielle peuvent être utilisées afin de créer des systèmes de conduite autonome performants. Dans cette ressource, nous nous intéresserons particulièrement à l’utilisation de l’apprentissage par renforcement pour répondre à notre problème.

Cette étude étant particulièrement adaptée à une séance de travaux pratiques, la ressource s’attache à détailler les différents éléments de l’apprentissage par renforcement et leur implémentation, en utilisant des outils logiciels adaptés. Les activités peuvent être effectuées à différents niveaux d’études en s’attachant plus ou moins à la construction de chacun des éléments (agent, environnement, récompenses, observations…). Les résultats des phases d’entrainements et la progression de l’agent présentent clairement l’apport de l’apprentissage par renforcement pour la résolution de problème complexes.

Cette ressource propose une méthode d’intégration d’un simulateur dans la démarche d’apprentissage par renforcement. Cette méthode peut être réutilisée et adaptée à d’autres problèmes d’apprentissage pour lesquels un simulateur est accessible. Cette ressource ne détaillera pas les concepts de l’apprentissage par renforcement mais s’orientera seulement vers leur mise en œuvre dans le cadre du problème de conduite autonome. Les aspects théoriques de l’apprentissage par renforcement peuvent être retrouvés dans d’autres ressources du « Dossier Intelligence Artificielle [9] ».

Contenu de la ressource :

  1. Introduction
  2. Déroulement de la séance de travaux pratiques
  3. Formalisme
  4. Définir les éléments d’apprentissage
  5. Observer les résultats
  6. Conclusion

La vidéo dont il est fait mention en section 4.1 est disponible ci-dessous :

Conduite sur le circuit de test par un modèle pré-entraîné fourni

Fichiers et liens
Icône PDF Apprentissage par renforcement de la conduite d’un véhicule sur AirSim [10]
Contenus associés : 
Introduction à l’apprentissage profond [11]
Image générée par un réseau de neurones à partir de la phrase « Un astronaute jouant au basketball dans l’espace avec des chats, dessiné comme dans un livre pour enfants » (OpenAI Dall-E 2) [11]
Cette ressource, la deuxième du « Dossier Intelligence Artificielle », présente l'outil à la source des progrès déterminants de l'IA au 21e siècle : les réseaux de neurones et leur entraînement dit apprentissage profond
Ressource pédagogique
Cours / présentation [12]
Auteur(s): 
JANNY Steeven [13]
DE MATTEIS Ludovic [14]
SHU-QUARTIER Wenqi [15]

URL source (modified on 19/07/2022 - 14:10):https://sti.eduscol.education.fr/si-ens-paris-saclay/ressources_pedagogiques/apprentissage-par-renforcement-dela-conduite-dun-vehicule-sur-airsim

Liens
[1] https://sti.eduscol.education.fr/utilisateurs/helene-horsin-molinaro?node=14734 [2] https://sti.eduscol.education.fr/system/files/images/ressources/pedagogiques/14734/14734-voiture-airsim-vignette.jpg [3] https://sti.eduscol.education.fr/system/files/images/ressources/pedagogiques/14734/14734-structure-du-probleme-et-interaction-des-differents-outils-logiciels-utilises.png [4] https://sti.eduscol.education.fr/system/files/images/ressources/pedagogiques/14734/14734-espace-des-actions-utilise-pour-la-resolution-de-notre-probleme.png [5] https://sti.eduscol.education.fr/system/files/images/ressources/pedagogiques/14734/14734-definition-du-modele-et-de-lalgorithme-dapprentissage.png [6] https://sti.eduscol.education.fr/system/files/images/ressources/pedagogiques/14734/14734-circuit-dentrainement.png [7] https://sti.eduscol.education.fr/system/files/images/ressources/pedagogiques/14734/14734-circuit-de-test.png [8] https://sti.eduscol.education.fr/system/files/images/ressources/pedagogiques/14734/14734-exemple-dune-trajectoire-obtenue-sur-le-circuit-de-test-pour-un-agent-entraine-pendant-environ.png [9] https://sti.eduscol.education.fr/si-ens-paris-saclay/ressources_pedagogiques/dossier-intelligence-artificielle [10] https://sti.eduscol.education.fr/sites/eduscol.education.fr.sti/files/ressources/pedagogiques/14734/14734-apprentissage-par-renforcement-de-la-conduite-dun-vehicule-sur-airsim-ensps.pdf [11] https://sti.eduscol.education.fr/si-ens-paris-saclay/ressources_pedagogiques/introduction-lapprentissage-profond [12] https://sti.eduscol.education.fr/lom-types-pedagogiques/cours-presentation [13] https://sti.eduscol.education.fr/si-ens-paris-saclay/personne/janny-steeven [14] https://sti.eduscol.education.fr/si-ens-paris-saclay/personne/de-matteis-ludovic [15] https://sti.eduscol.education.fr/si-ens-paris-saclay/personne/shu-quartier-wenqi