Membangun decision tree dengan paket rpart()

Pemodelan Risiko Kredit di R

Lore Dirick

Manager of Data Science Curriculum at Flatiron School

Bayangkan...

animasi decision tree

Pemodelan Risiko Kredit di R

Paket rpart()! Namun...

  • Sulit membangun decision tree yang baik untuk data risiko kredit
  • Alasan utama: data tidak seimbang
fit_default <- rpart(loan_status ~ ., method = "class", 
                     data = training_set)
plot(fit_default)
Error in plot.rpart(fit_default) : fit is not a tree, just a root
Pemodelan Risiko Kredit di R

Tiga teknik mengatasi ketidakseimbangan

  • Undersampling atau oversampling
    • Masalah akurasi akan hilang
    • Hanya pada training set
  • Mengubah prior probabilities
  • Menambahkan loss matrix

Validasi model untuk memilih yang terbaik!

Pemodelan Risiko Kredit di R

Ayo berlatih!

Pemodelan Risiko Kredit di R

Preparing Video For Download...