Basis van reinforcement learning
Reinforcement Learning met Gymnasium in Python
Fouad Trad
Machine Learning Engineer
Reinforcement learning
Agent leert via trial-and-error
Reinforcement learning
Agent leert via trial-and-error
Reinforcement learning
Agent leert via trial-and-error
Reinforcement learning
Agent leert via trial-and-error
Agent krijgt:
Beloningen voor goede acties
Straffen voor foute acties
Doel
: positieve feedback door de tijd maximaliseren
RL als een huisdier trainen
RL vs. andere ML-typen
RL vs. andere ML-typen
RL vs. andere ML-typen
Wanneer RL gebruiken?
Sequentiële besluitvorming
Beslissingen beïnvloeden latere observaties
Leren via beloningen en straffen
Geen directe supervisie
Geschikt voor RL: videogames spelen
Speler neemt sequentiële beslissingen
Krijgt punten en verliest levens afhankelijk van acties
Ongeschikt voor RL: objectherkenning in games
Geen sequentiële besluitvorming
Geen interactie met een omgeving
Toepassingen van RL
Robotica
Robot laten lopen
Objectmanipulatie
Toepassingen van RL
Robotica
Robot laten lopen
Objectmanipulatie
Financiën
Handel en belegging optimaliseren
Winst maximaliseren
Toepassingen van RL
Autonome voertuigen
Veiligheid en efficiëntie verbeteren
Ongevallenrisico minimaliseren
Toepassingen van RL
Autonome voertuigen
Veiligheid en efficiëntie verbeteren
Ongevallenrisico minimaliseren
Chatbots ontwikkelen
Gespreksvaardigheden verbeteren
Betere gebruikerservaring
Wat komt er nu?
In deze course:
Basis en principes van RL begrijpen
RL-problemen herkennen, formuleren en oplossen
Toepassen met Gymnasium
Laten we oefenen!
Reinforcement Learning met Gymnasium in Python
Preparing Video For Download...