Dasar-dasar reinforcement learning

Reinforcement Learning dengan Gymnasium di Python

Fouad Trad

Machine Learning Engineer

Reinforcement learning

 

  • Agen belajar lewat coba-coba

 

Gambar menunjukkan dua ikon: satu agen, satu lingkungan.

Reinforcement Learning dengan Gymnasium di Python

Reinforcement learning

 

  • Agen belajar lewat coba-coba

 

Gambar menunjukkan bahwa observasi diberikan dari lingkungan ke agen.

Reinforcement Learning dengan Gymnasium di Python

Reinforcement learning

 

  • Agen belajar lewat coba-coba

 

Gambar menunjukkan lingkungan memberi agen observasi, lalu agen melakukan aksi sesuai itu.

Reinforcement Learning dengan Gymnasium di Python

Reinforcement learning

 

  • Agen belajar lewat coba-coba
  • Agen menerima:
    • Imbalan untuk keputusan baik
    • Penalti untuk keputusan buruk
  • Tujuan: memaksimalkan umpan balik positif dari waktu ke waktu

 

Gambar menunjukkan lingkungan memberi agen observasi, lalu agen melakukan aksi, dan menerima imbalan atau penalti berdasarkan aksi tersebut.

Reinforcement Learning dengan Gymnasium di Python

RL seperti melatih hewan peliharaan

Gambar memperlihatkan seorang pria tua (lingkungan) melatih hewan peliharaan (agen).

Reinforcement Learning dengan Gymnasium di Python

RL vs. jenis ML lain

Gambar menunjukkan tabel berjudul "Supervised Learning," bahwa tipe data yang digunakan adalah data berlabel, tujuan utama memprediksi keluaran dari data masukan, cocok untuk klasifikasi dan regresi.

Reinforcement Learning dengan Gymnasium di Python

RL vs. jenis ML lain

Gambar menunjukkan tabel yang membandingkan Supervised Learning dan Unsupervised Learning. Untuk Supervised: tipe data berlabel, tujuan memprediksi keluaran dari masukan, cocok untuk klasifikasi dan regresi. Untuk Unsupervised: tipe data tanpa label, tujuan menemukan pola/asosiasi, cocok untuk klastering dan analisis asosiasi.

Reinforcement Learning dengan Gymnasium di Python

RL vs. jenis ML lain

Gambar menampilkan tabel yang menambahkan RL ke perbandingan Supervised dan Unsupervised. Supervised memakai data berlabel untuk prediksi; cocok untuk klasifikasi/regresi. Unsupervised memakai data tanpa label untuk menemukan pola/asosiasi; cocok untuk klastering/analisis asosiasi. RL tidak memerlukan data latih terdefinisi; fokus membuat keputusan yang memaksimalkan imbalan dari lingkungan; cocok untuk tugas pengambilan keputusan.

Reinforcement Learning dengan Gymnasium di Python

Kapan memakai RL?

 

  • Pengambilan keputusan berurutan
    • Keputusan memengaruhi observasi berikutnya
  • Belajar lewat imbalan dan penalti
    • Tanpa supervisi langsung

Ikon robot

Reinforcement Learning dengan Gymnasium di Python

Cocok untuk RL: bermain gim video

  • Pemain membuat keputusan berurutan
  • Mendapat poin dan kehilangan nyawa tergantung aksi

Gambar menunjukkan adegan gim video saat agen mengambil keputusan.

Reinforcement Learning dengan Gymnasium di Python

Tidak cocok untuk RL: deteksi objek dalam gim

  • Tidak ada keputusan berurutan
  • Tidak ada interaksi dengan lingkungan

Gambar menampilkan cuplikan gim dengan tugas mengenali berbagai jenis pokemon.

Reinforcement Learning dengan Gymnasium di Python

Aplikasi RL

Robotika
  • Robot berjalan
  • Manipulasi objek

Gambar menunjukkan tangan robot.

Reinforcement Learning dengan Gymnasium di Python

Aplikasi RL

Robotika
  • Robot berjalan
  • Manipulasi objek

Gambar menunjukkan tangan robot.

Keuangan
  • Optimasi trading dan investasi
  • Memaksimalkan laba

Gambar menggambarkan sejumlah besar uang keluar dari koper terbuka di latar biru, menggambarkan keberhasilan finansial.

Reinforcement Learning dengan Gymnasium di Python

Aplikasi RL

Kendaraan otonom
  • Meningkatkan keselamatan dan efisiensi
  • Meminimalkan risiko kecelakaan

Gambar menunjukkan beberapa kendaraan otonom di jalan.

Reinforcement Learning dengan Gymnasium di Python

Aplikasi RL

Kendaraan otonom
  • Meningkatkan keselamatan dan efisiensi
  • Meminimalkan risiko kecelakaan

Gambar menunjukkan beberapa kendaraan otonom di jalan.

Pengembangan chatbot
  • Meningkatkan kemampuan percakapan
  • Memperbaiki pengalaman pengguna

Gambar menunjukkan chatbot percakapan.

Reinforcement Learning dengan Gymnasium di Python

Selanjutnya apa?

Di kursus ini Anda akan:

  • Memahami dasar dan prinsip RL
  • Mengidentifikasi, merumuskan, dan menyelesaikan masalah RL
  • Praktik dengan Gymnasium

Gambar untuk logo Gymnasium.

Reinforcement Learning dengan Gymnasium di Python

Ayo berlatih!

Reinforcement Learning dengan Gymnasium di Python

Preparing Video For Download...