Pekiştirmeli öğrenmenin temelleri

Python ile Gymnasium'da Reinforcement Learning

Fouad Trad

Machine Learning Engineer

Pekiştirmeli öğrenme

 

  • Ajan deneme-yanılma ile öğrenir

 

Görselde bir ajan ve bir çevre simgesi bulunur.

Python ile Gymnasium'da Reinforcement Learning

Pekiştirmeli öğrenme

 

  • Ajan deneme-yanılma ile öğrenir

 

Görsel, gözlemlerin çevreden ajana verildiğini gösterir.

Python ile Gymnasium'da Reinforcement Learning

Pekiştirmeli öğrenme

 

  • Ajan deneme-yanılma ile öğrenir

 

Görsel, çevrenin ajana gözlemler sağladığını ve ajanın buna göre eylemler gerçekleştirdiğini gösterir.

Python ile Gymnasium'da Reinforcement Learning

Pekiştirmeli öğrenme

 

  • Ajan deneme-yanılma ile öğrenir
  • Ajan şunları alır:
    • İyi kararlar için ödül
    • Kötü kararlar için ceza
  • Amaç: zaman içinde olumlu geri bildirimi en üst düzeye çıkarmak

 

Görsel, çevrenin ajana gözlemler sağladığını; ardından ajanın eylemler gerçekleştirdiğini ve bu eylemlere göre ödül veya ceza aldığını gösterir.

Python ile Gymnasium'da Reinforcement Learning

Bir evcil hayvanı eğitmek gibi RL

Görselde yaşlı bir adam (çevre) bir evcil hayvanı (ajan) eğitiyor.

Python ile Gymnasium'da Reinforcement Learning

RL ve diğer ML türleri

Görselde “Denetimli Öğrenme” başlıklı bir tablo yer alır; veri türü: etiketli veri, ana hedef: girdilere göre çıktıları tahmin etmek, uygun görevler: sınıflandırma ve regresyon.

Python ile Gymnasium'da Reinforcement Learning

RL ve diğer ML türleri

Görsel, Denetimli ve Denetimsiz Öğrenmeyi karşılaştıran bir tablo gösterir. Denetimli: etiketli veri, hedef: tahmin; sınıflandırma ve regresyona uygun. Denetimsiz: etiketlenmemiş veri, hedef: örüntü/ilişki keşfi; kümeleme ve birliktelik analizine uygun.

Python ile Gymnasium'da Reinforcement Learning

RL ve diğer ML türleri

Görsel, karşılaştırmayı RL’yi de içerecek şekilde genişleten bir tablo gösterir. Denetimli: etiketli veriyle tahmin; sınıflandırma/regresyona uygun. Denetimsiz: etiketlenmemiş veriyle örüntü/ilişki keşfi; kümeleme ve birliktelik analizine uygun. RL: önceden tanımlı eğitim verisi gerektirmez; çevreden alınan ödülleri en üst düzeye çıkaracak kararlar almaya odaklanır; karar verme görevlerine uygundur.

Python ile Gymnasium'da Reinforcement Learning

RL ne zaman kullanılır?

 

  • Sıralı karar verme
    • Kararlar gelecekteki gözlemleri etkiler
  • Ödül ve cezalarla öğrenme
    • Doğrudan denetim yok

Bir robot simgesi

Python ile Gymnasium'da Reinforcement Learning

RL için uygun: video oyunu oynamak

  • Oyuncu ardışık kararlar verir
  • Eylemlere göre puan alır, can kaybeder

Görsel, ajanın karar verdiği bir video oyunu sahnesini gösterir.

Python ile Gymnasium'da Reinforcement Learning

RL için uygun değil: oyun içi nesne tanıma

  • Sıralı karar verme yok
  • Çevreyle etkileşim yok

Görsel, farklı pokemon türlerini tanıma hedefi olan bir oyun karesini gösterir.

Python ile Gymnasium'da Reinforcement Learning

RL uygulamaları

Robotik
  • Robot yürütme
  • Nesne manipülasyonu

Görselde bir robot eli yer alır.

Python ile Gymnasium'da Reinforcement Learning

RL uygulamaları

Robotik
  • Robot yürütme
  • Nesne manipülasyonu

Görselde bir robot eli yer alır.

Finans
  • Alım satım ve yatırımın optimize edilmesi
  • Kârın maksimize edilmesi

Görsel, mavi arka planda açık bir evrak çantasından uçuşan büyük miktarda parayla finansal başarı kavramını betimler.

Python ile Gymnasium'da Reinforcement Learning

RL uygulamaları

Otonom Araçlar
  • Güvenlik ve verimliliği artırma
  • Kaza risklerini en aza indirme

Görselde yolda ilerleyen birkaç otonom araç görülür.

Python ile Gymnasium'da Reinforcement Learning

RL uygulamaları

Otonom Araçlar
  • Güvenlik ve verimliliği artırma
  • Kaza risklerini en aza indirme

Görselde yolda ilerleyen birkaç otonom araç görülür.

Chatbot geliştirme
  • Diyalog becerilerini geliştirme
  • Kullanıcı deneyimini iyileştirme

Görselde bir sohbet botu yer alır.

Python ile Gymnasium'da Reinforcement Learning

Sırada ne var?

Bu derste şunları yapacağız:

  • RL’in temellerini ve ilkelerini kavramak
  • RL problemlerini belirlemek, çerçevelemek ve çözmek
  • Gymnasium ile uygulama

Gymnasium logosu görseli.

Python ile Gymnasium'da Reinforcement Learning

Hadi pratik yapalım!

Python ile Gymnasium'da Reinforcement Learning

Preparing Video For Download...