Basis van reinforcement learning

Reinforcement Learning met Gymnasium in Python

Fouad Trad

Machine Learning Engineer

Reinforcement learning

 

  • Agent leert via trial-and-error

 

Afbeelding met twee iconen: een agent en een omgeving.

Reinforcement Learning met Gymnasium in Python

Reinforcement learning

 

  • Agent leert via trial-and-error

 

Afbeelding toont dat de omgeving observaties aan de agent geeft.

Reinforcement Learning met Gymnasium in Python

Reinforcement learning

 

  • Agent leert via trial-and-error

 

Afbeelding toont dat de omgeving de agent observaties geeft, waarna de agent daarop acties uitvoert.

Reinforcement Learning met Gymnasium in Python

Reinforcement learning

 

  • Agent leert via trial-and-error
  • Agent krijgt:
    • Beloningen voor goede acties
    • Straffen voor foute acties
  • Doel: positieve feedback door de tijd maximaliseren

 

Afbeelding toont dat de omgeving de agent observaties geeft, waarna de agent acties uitvoert en beloningen of straffen krijgt op basis van die acties.

Reinforcement Learning met Gymnasium in Python

RL als een huisdier trainen

Afbeelding van een oude man (de omgeving) die een huisdier (de agent) traint.

Reinforcement Learning met Gymnasium in Python

RL vs. andere ML-typen

De afbeelding toont een tabel met de titel "Supervised Learning" met gelabelde data, doel is uitkomsten voorspellen op basis van input, geschikt voor classificatie en regressie.

Reinforcement Learning met Gymnasium in Python

RL vs. andere ML-typen

Tabel vergelijkt Supervised en Unsupervised Learning. Supervised: gelabelde data, doel is voorspellen, geschikt voor classificatie en regressie. Unsupervised: ongelabelde data, doel is patronen/associaties vinden, geschikt voor clustering en associatieregels.

Reinforcement Learning met Gymnasium in Python

RL vs. andere ML-typen

De tabel voegt RL toe naast Supervised en Unsupervised. Supervised: gelabelde data om te voorspellen. Unsupervised: ongelabelde data om patronen te vinden. RL: geen vooraf gedefinieerde trainingsdata; focust op beslissingen die beloning uit de omgeving maximaliseren; geschikt voor besluitvormingstaken.

Reinforcement Learning met Gymnasium in Python

Wanneer RL gebruiken?

 

  • Sequentiële besluitvorming
    • Beslissingen beïnvloeden latere observaties
  • Leren via beloningen en straffen
    • Geen directe supervisie

Pictogram van een robot

Reinforcement Learning met Gymnasium in Python

Geschikt voor RL: videogames spelen

  • Speler neemt sequentiële beslissingen
  • Krijgt punten en verliest levens afhankelijk van acties

Afbeelding van een videogamescène waar de agent een beslissing neemt.

Reinforcement Learning met Gymnasium in Python

Ongeschikt voor RL: objectherkenning in games

  • Geen sequentiële besluitvorming
  • Geen interactie met een omgeving

Afbeelding van een gameframe met als doel verschillende soorten pokémon herkennen.

Reinforcement Learning met Gymnasium in Python

Toepassingen van RL

Robotica
  • Robot laten lopen
  • Objectmanipulatie

Afbeelding van een robothand.

Reinforcement Learning met Gymnasium in Python

Toepassingen van RL

Robotica
  • Robot laten lopen
  • Objectmanipulatie

Afbeelding van een robothand.

Financiën
  • Handel en belegging optimaliseren
  • Winst maximaliseren

Afbeelding van veel geld dat uit een open aktetas vliegt tegen een blauwe achtergrond, staat voor financieel succes.

Reinforcement Learning met Gymnasium in Python

Toepassingen van RL

Autonome voertuigen
  • Veiligheid en efficiëntie verbeteren
  • Ongevallenrisico minimaliseren

Afbeelding van meerdere autonome voertuigen op de weg.

Reinforcement Learning met Gymnasium in Python

Toepassingen van RL

Autonome voertuigen
  • Veiligheid en efficiëntie verbeteren
  • Ongevallenrisico minimaliseren

Afbeelding van meerdere autonome voertuigen op de weg.

Chatbots ontwikkelen
  • Gespreksvaardigheden verbeteren
  • Betere gebruikerservaring

Afbeelding van een conversatiechatbot.

Reinforcement Learning met Gymnasium in Python

Wat komt er nu?

In deze course:

  • Basis en principes van RL begrijpen
  • RL-problemen herkennen, formuleren en oplossen
  • Toepassen met Gymnasium

Afbeelding van het Gymnasium-logo.

Reinforcement Learning met Gymnasium in Python

Laten we oefenen!

Reinforcement Learning met Gymnasium in Python

Preparing Video For Download...