Notions de base de l’apprentissage par renforcement

Reinforcement Learning avec Gymnasium en Python

Fouad Trad

Machine Learning Engineer

Apprentissage par renforcement

 

  • L’agent apprend par essais-erreurs

 

Image montrant deux icônes : un agent et l’environnement.

Reinforcement Learning avec Gymnasium en Python

Apprentissage par renforcement

 

  • L’agent apprend par essais-erreurs

 

Image montrant que l’environnement fournit des observations à l’agent.

Reinforcement Learning avec Gymnasium en Python

Apprentissage par renforcement

 

  • L’agent apprend par essais-erreurs

 

Image montrant que l’environnement fournit des observations à l’agent, puis l’agent agit en conséquence.

Reinforcement Learning avec Gymnasium en Python

Apprentissage par renforcement

 

  • L’agent apprend par essais-erreurs
  • L’agent reçoit :
    • Récompenses pour de bonnes décisions
    • Pénalités pour de mauvaises décisions
  • Objectif : maximiser les retours positifs dans le temps

 

Image montrant que l’environnement fournit des observations à l’agent, puis l’agent agit et reçoit des récompenses ou pénalités selon ses actions.

Reinforcement Learning avec Gymnasium en Python

AR comme dressage d’un animal

Image montrant un homme âgé (l’environnement) dressant un animal de compagnie (l’agent).

Reinforcement Learning avec Gymnasium en Python

AR vs. autres types d’AM

L’image montre un tableau intitulé « Apprentissage supervisé », indiquant que le type de données est étiqueté, l’objectif est de prédire des résultats à partir des entrées, adapté à la classification et à la régression.

Reinforcement Learning avec Gymnasium en Python

AR vs. autres types d’AM

L’image montre un tableau comparant l’apprentissage supervisé et non supervisé. Supervisé : données étiquetées, objectif : prédire des résultats, adapté à la classification et à la régression. Non supervisé : données non étiquetées, objectif : découvrir des motifs ou associations, adapté au clustering et à l’analyse d’association.

Reinforcement Learning avec Gymnasium en Python

AR vs. autres types d’AM

L’image affiche un tableau ajoutant l’AR à la comparaison avec le supervisé et le non supervisé. Supervisé : données étiquetées pour prédire des résultats (classification, régression). Non supervisé : données non étiquetées pour découvrir des motifs/associations (clustering, analyse d’association). L’AR n’exige pas de données d’entraînement prédéfinies et vise des décisions maximisant les récompenses de l’environnement, adapté aux tâches de décision.

Reinforcement Learning avec Gymnasium en Python

Quand utiliser l’AR ?

 

  • Décisions séquentielles
    • Les décisions influencent les observations futures
  • Apprentissage par récompenses et pénalités
    • Pas de supervision directe

Icône d’un robot

Reinforcement Learning avec Gymnasium en Python

Pertinent pour l’AR : jouer aux jeux vidéo

  • Le joueur prend des décisions séquentielles
  • Gagne des points et perd des vies selon ses actions

Image montrant une scène de jeu vidéo où l’agent prend une décision.

Reinforcement Learning avec Gymnasium en Python

Non pertinent pour l’AR : reconnaissance d’objets en jeu

  • Pas de décisions séquentielles
  • Pas d’interaction avec un environnement

Image montrant une image de jeu où le but est de reconnaître différents pokémons.

Reinforcement Learning avec Gymnasium en Python

Applications de l’AR

Robotique
  • Marche du robot
  • Manipulation d’objets

Image montrant une main robotique.

Reinforcement Learning avec Gymnasium en Python

Applications de l’AR

Robotique
  • Marche du robot
  • Manipulation d’objets

Image montrant une main robotique.

Finance
  • Optimiser le trading et l’investissement
  • Maximiser le profit

Image représentant une grosse somme d’argent s’envolant d’une mallette ouverte sur fond bleu, exprimant la réussite financière.

Reinforcement Learning avec Gymnasium en Python

Applications de l’AR

Véhicules autonomes
  • Améliorer sécurité et efficacité
  • Réduire les risques d’accident

Image montrant plusieurs véhicules autonomes roulant sur la route.

Reinforcement Learning avec Gymnasium en Python

Applications de l’AR

Véhicules autonomes
  • Améliorer sécurité et efficacité
  • Réduire les risques d’accident

Image montrant plusieurs véhicules autonomes roulant sur la route.

Développement de chatbots
  • Améliorer les capacités de conversation
  • Améliorer l’expérience utilisateur

Image montrant un chatbot conversationnel.

Reinforcement Learning avec Gymnasium en Python

Et ensuite ?

Dans ce cours, vous allez :

  • Comprendre les bases et principes de l’AR
  • Identifier, formuler et résoudre des problèmes d’AR
  • Mettre en pratique avec Gymnasium

Image pour le logo Gymnasium.

Reinforcement Learning avec Gymnasium en Python

Passons à la pratique !

Reinforcement Learning avec Gymnasium en Python

Preparing Video For Download...