Dasar-dasar reinforcement learning
Reinforcement Learning dengan Gymnasium di Python
Fouad Trad
Machine Learning Engineer
Reinforcement learning
Agen belajar lewat coba-coba
Reinforcement learning
Agen belajar lewat coba-coba
Reinforcement learning
Agen belajar lewat coba-coba
Reinforcement learning
Agen belajar lewat coba-coba
Agen menerima:
Imbalan untuk keputusan baik
Penalti untuk keputusan buruk
Tujuan
: memaksimalkan umpan balik positif dari waktu ke waktu
RL seperti melatih hewan peliharaan
RL vs. jenis ML lain
RL vs. jenis ML lain
RL vs. jenis ML lain
Kapan memakai RL?
Pengambilan keputusan berurutan
Keputusan memengaruhi observasi berikutnya
Belajar lewat imbalan dan penalti
Tanpa supervisi langsung
Cocok untuk RL: bermain gim video
Pemain membuat keputusan berurutan
Mendapat poin dan kehilangan nyawa tergantung aksi
Tidak cocok untuk RL: deteksi objek dalam gim
Tidak ada keputusan berurutan
Tidak ada interaksi dengan lingkungan
Aplikasi RL
Robotika
Robot berjalan
Manipulasi objek
Aplikasi RL
Robotika
Robot berjalan
Manipulasi objek
Keuangan
Optimasi trading dan investasi
Memaksimalkan laba
Aplikasi RL
Kendaraan otonom
Meningkatkan keselamatan dan efisiensi
Meminimalkan risiko kecelakaan
Aplikasi RL
Kendaraan otonom
Meningkatkan keselamatan dan efisiensi
Meminimalkan risiko kecelakaan
Pengembangan chatbot
Meningkatkan kemampuan percakapan
Memperbaiki pengalaman pengguna
Selanjutnya apa?
Di kursus ini Anda akan:
Memahami dasar dan prinsip RL
Mengidentifikasi, merumuskan, dan menyelesaikan masalah RL
Praktik dengan Gymnasium
Ayo berlatih!
Reinforcement Learning dengan Gymnasium di Python
Preparing Video For Download...