Pekiştirmeli öğrenmenin temelleri
Python ile Gymnasium'da Reinforcement Learning
Fouad Trad
Machine Learning Engineer
Pekiştirmeli öğrenme
Ajan deneme-yanılma ile öğrenir
Pekiştirmeli öğrenme
Ajan deneme-yanılma ile öğrenir
Pekiştirmeli öğrenme
Ajan deneme-yanılma ile öğrenir
Pekiştirmeli öğrenme
Ajan deneme-yanılma ile öğrenir
Ajan şunları alır:
İyi kararlar için ödül
Kötü kararlar için ceza
Amaç
: zaman içinde olumlu geri bildirimi en üst düzeye çıkarmak
Bir evcil hayvanı eğitmek gibi RL
RL ve diğer ML türleri
RL ve diğer ML türleri
RL ve diğer ML türleri
RL ne zaman kullanılır?
Sıralı karar verme
Kararlar gelecekteki gözlemleri etkiler
Ödül ve cezalarla öğrenme
Doğrudan denetim yok
RL için uygun: video oyunu oynamak
Oyuncu ardışık kararlar verir
Eylemlere göre puan alır, can kaybeder
RL için uygun değil: oyun içi nesne tanıma
Sıralı karar verme yok
Çevreyle etkileşim yok
RL uygulamaları
Robotik
Robot yürütme
Nesne manipülasyonu
RL uygulamaları
Robotik
Robot yürütme
Nesne manipülasyonu
Finans
Alım satım ve yatırımın optimize edilmesi
Kârın maksimize edilmesi
RL uygulamaları
Otonom Araçlar
Güvenlik ve verimliliği artırma
Kaza risklerini en aza indirme
RL uygulamaları
Otonom Araçlar
Güvenlik ve verimliliği artırma
Kaza risklerini en aza indirme
Chatbot geliştirme
Diyalog becerilerini geliştirme
Kullanıcı deneyimini iyileştirme
Sırada ne var?
Bu derste şunları yapacağız:
RL’in temellerini ve ilkelerini kavramak
RL problemlerini belirlemek, çerçevelemek ve çözmek
Gymnasium ile uygulama
Hadi pratik yapalım!
Python ile Gymnasium'da Reinforcement Learning
Preparing Video For Download...