Machine Learning dengan Model Berbasis Pohon di R
Sandro Raabe
Data Scientist
no bisa mencapai akurasi 98%→ Mungkin terjadi pada data tidak seimbang dengan 98% sampel negatif






predictions
# A tibble: 153 x 2
.pred_class true_class
<fct> <fct>
1 yes no
2 no no
3 no yes
4 yes yes
# Hitung sensitivitas untuk satu ambang
sens(predictions,
estimate = .pred_class,
truth = true_class)
# A tibble: 1 x 2
.metric .estimate
<chr> <dbl>
1 sensitivity 0.872
accuracy() dan conf_mat()# Prediksi probabilitas pada test set predictions <- predict(model, data_test,type = "prob") %>%bind_cols(data_test)
# A tibble: 9,116 x 13
.pred_yes still_customer age gender ...
<dbl> <fct> <int> <fct> ...
1 0.0557 no 45 M ...
2 0.0625 no 49 F ...
3 0.330 no 51 M ...
4 ...
...
# Hitung kurva ROC untuk semua ambang roc <- roc_curve(predictions,estimate = .pred_yes,truth = still_customer)# Plot kurva ROC autoplot(roc)

# Hitung luas di bawah kurva
roc_auc(predictions,
estimate = .pred_yes,
truth = still_customer)
# A tibble: 1 x 3
.metric .estimator .estimate
<chr> <chr> <dbl>
1 roc_auc binary 0.872
Machine Learning dengan Model Berbasis Pohon di R