Random forest

Machine Learning dengan Model Berbasis Pohon di R

Sandro Raabe

Data Scientist

Random forest

  • Cocok untuk data berdimensi tinggi
  • Mudah digunakan
  • Performa langsung pakai
  • Tersedia di berbagai paket: ranger, randomForest
  • Antarmuka tidymodels ke paket ini: rand_forest() (dalam paket parsnip)
Machine Learning dengan Model Berbasis Pohon di R

Ide

  • Gagasan dasar (sama dengan bagging): latih pohon pada sampel bootstrap
  • Perbedaan kunci: prediktor acak antar pohon $\rightarrow$ hutan acak
Machine Learning dengan Model Berbasis Pohon di R

Intuisi

sketsa random forest

Machine Learning dengan Model Berbasis Pohon di R

Coding: Spesifikasikan model random forest

  • Nama fungsi: rand_forest()

Hyperparameter:

  • mtry: prediktor yang dilihat di tiap node, default:
    $$\left\lfloor\sqrt\text{num predictors}\right\rfloor$$
  • trees: jumlah pohon di hutan
  • min_n: ukuran node minimum yang diizinkan
rand_forest(

mtry = 4,
trees = 500,
min_n = 10) %>%
# Set the mode set_mode("classification") %>%
# Use engine ranger or randomForest set_engine("ranger")
Machine Learning dengan Model Berbasis Pohon di R

Coding: Spesifikasikan model random forest

spec <- rand_forest(trees = 100) %>%

set_mode("classification") %>%
set_engine("ranger")
Spesifikasi Model Random Forest

(classification)
Argumen Utama: trees = 100
Mesin komputasi: ranger
Machine Learning dengan Model Berbasis Pohon di R

Melatih hutan

spec %>% fit(still_customer ~ ., data = customers_train)
objek model parsnip

Waktu fit:  631ms 
Hasil ranger

Jumlah pohon:                     100 
Ukuran sampel:                   9116 
Jumlah variabel independen:      19 
Mtry:                             4 
Ukuran node target:              10
Machine Learning dengan Model Berbasis Pohon di R

Kepentingan variabel

rand_forest(mode = "classification") %>%
    set_engine("ranger", importance = "impurity") %>%

fit(still_customer ~ ., data = customers_train) %>%
vip::vip()

plot vip

Machine Learning dengan Model Berbasis Pohon di R

Mari tanam random forest!

Machine Learning dengan Model Berbasis Pohon di R

Preparing Video For Download...