Pekiştirmeli öğrenmenin temelleri

Python ile Gymnasium'da Reinforcement Learning

Fouad Trad

Machine Learning Engineer

Pekiştirmeli öğrenme

Ajan deneme-yanılma ile öğrenir

Görselde bir ajan ve bir çevre simgesi bulunur.

Pekiştirmeli öğrenme

Ajan deneme-yanılma ile öğrenir

Görsel, gözlemlerin çevreden ajana verildiğini gösterir.

Pekiştirmeli öğrenme

Ajan deneme-yanılma ile öğrenir

Görsel, çevrenin ajana gözlemler sağladığını ve ajanın buna göre eylemler gerçekleştirdiğini gösterir.

Pekiştirmeli öğrenme

Ajan deneme-yanılma ile öğrenir
Ajan şunları alır:
- İyi kararlar için ödül
- Kötü kararlar için ceza
Amaç: zaman içinde olumlu geri bildirimi en üst düzeye çıkarmak

Görsel, çevrenin ajana gözlemler sağladığını; ardından ajanın eylemler gerçekleştirdiğini ve bu eylemlere göre ödül veya ceza aldığını gösterir.

Bir evcil hayvanı eğitmek gibi RL

Görselde yaşlı bir adam (çevre) bir evcil hayvanı (ajan) eğitiyor.

RL ve diğer ML türleri

Görselde “Denetimli Öğrenme” başlıklı bir tablo yer alır; veri türü: etiketli veri, ana hedef: girdilere göre çıktıları tahmin etmek, uygun görevler: sınıflandırma ve regresyon.

RL ve diğer ML türleri

Görsel, Denetimli ve Denetimsiz Öğrenmeyi karşılaştıran bir tablo gösterir. Denetimli: etiketli veri, hedef: tahmin; sınıflandırma ve regresyona uygun. Denetimsiz: etiketlenmemiş veri, hedef: örüntü/ilişki keşfi; kümeleme ve birliktelik analizine uygun.