Dasar-dasar reinforcement learning

Reinforcement Learning dengan Gymnasium di Python

Fouad Trad

Machine Learning Engineer

Reinforcement learning

Agen belajar lewat coba-coba

Gambar menunjukkan dua ikon: satu agen, satu lingkungan.

Reinforcement learning

Agen belajar lewat coba-coba

Gambar menunjukkan bahwa observasi diberikan dari lingkungan ke agen.

Reinforcement learning

Agen belajar lewat coba-coba

Gambar menunjukkan lingkungan memberi agen observasi, lalu agen melakukan aksi sesuai itu.

Reinforcement learning

Agen belajar lewat coba-coba
Agen menerima:
- Imbalan untuk keputusan baik
- Penalti untuk keputusan buruk
Tujuan: memaksimalkan umpan balik positif dari waktu ke waktu

Gambar menunjukkan lingkungan memberi agen observasi, lalu agen melakukan aksi, dan menerima imbalan atau penalti berdasarkan aksi tersebut.

RL seperti melatih hewan peliharaan

Gambar memperlihatkan seorang pria tua (lingkungan) melatih hewan peliharaan (agen).

RL vs. jenis ML lain

Gambar menunjukkan tabel berjudul "Supervised Learning," bahwa tipe data yang digunakan adalah data berlabel, tujuan utama memprediksi keluaran dari data masukan, cocok untuk klasifikasi dan regresi.

RL vs. jenis ML lain

Gambar menunjukkan tabel yang membandingkan Supervised Learning dan Unsupervised Learning. Untuk Supervised: tipe data berlabel, tujuan memprediksi keluaran dari masukan, cocok untuk klasifikasi dan regresi. Untuk Unsupervised: tipe data tanpa label, tujuan menemukan pola/asosiasi, cocok untuk klastering dan analisis asosiasi.