Notions de base de l’apprentissage par renforcement
Reinforcement Learning avec Gymnasium en Python
Fouad Trad
Machine Learning Engineer
Apprentissage par renforcement
L’agent apprend par essais-erreurs
Apprentissage par renforcement
L’agent apprend par essais-erreurs
Apprentissage par renforcement
L’agent apprend par essais-erreurs
Apprentissage par renforcement
L’agent apprend par essais-erreurs
L’agent reçoit :
Récompenses pour de bonnes décisions
Pénalités pour de mauvaises décisions
Objectif : maximiser les retours positifs dans le temps
AR comme dressage d’un animal
AR vs. autres types d’AM
AR vs. autres types d’AM
AR vs. autres types d’AM
Quand utiliser l’AR ?
Décisions séquentielles
Les décisions influencent les observations futures
Apprentissage par récompenses et pénalités
Pas de supervision directe
Pertinent pour l’AR : jouer aux jeux vidéo
Le joueur prend des décisions séquentielles
Gagne des points et perd des vies selon ses actions
Non pertinent pour l’AR : reconnaissance d’objets en jeu
Pas de décisions séquentielles
Pas d’interaction avec un environnement
Applications de l’AR
Robotique
Marche du robot
Manipulation d’objets
Applications de l’AR
Robotique
Marche du robot
Manipulation d’objets
Finance
Optimiser le trading et l’investissement
Maximiser le profit
Applications de l’AR
Véhicules autonomes
Améliorer sécurité et efficacité
Réduire les risques d’accident
Applications de l’AR
Véhicules autonomes
Améliorer sécurité et efficacité
Réduire les risques d’accident
Développement de chatbots
Améliorer les capacités de conversation
Améliorer l’expérience utilisateur
Et ensuite ?
Dans ce cours, vous allez :
Comprendre les bases et principes de l’AR
Identifier, formuler et résoudre des problèmes d’AR
Mettre en pratique avec Gymnasium
Passons à la pratique !
Reinforcement Learning avec Gymnasium en Python
Preparing Video For Download...