Prediksi dan evaluasi

Machine Learning dengan Model Berbasis Pohon di R

Sandro Raabe

Data Scientist

Memprediksi pada data baru

Panggilan umum:
predict(model, new_data, type)
Argumen:
  1. Model terlatih
  2. Data untuk diprediksi
  3. Jenis prediksi: label atau probabilitas
Machine Learning dengan Model Berbasis Pohon di R

Memprediksi pada data baru

predict(model, new_data = test_data, 
               type = "class")
  .pred_class
  <fct>      
1 no         
2 no         
3 yes        
4 no
predict(model, new_data = test_data, 
               type = "prob")
     .pred_no  .pred_yes
     <dbl>     <dbl>
1    0.866     0.134
2    0.956     0.044
3    0.672     0.328
4    0.877     0.123
Machine Learning dengan Model Berbasis Pohon di R

Matriks konfusi

matriks_konfusi_1

  • Menunjukkan seberapa bingung model
Machine Learning dengan Model Berbasis Pohon di R

Matriks konfusi

matriks_konfusi_2

Machine Learning dengan Model Berbasis Pohon di R

Matriks konfusi

matriks_konfusi_3

Machine Learning dengan Model Berbasis Pohon di R

Matriks konfusi

matriks_konfusi_4

  • Diagonal: prediksi benar
  • Di luar diagonal: prediksi salah
Machine Learning dengan Model Berbasis Pohon di R

Matriks konfusi

 

  • TP: prediksi ya, kebenaran ya
  • TN: prediksi tidak, kebenaran tidak
  • FP: prediksi ya, kebenaran tidak
  • FN: prediksi tidak, kebenaran ya

matriks_konfusi_4

Machine Learning dengan Model Berbasis Pohon di R

Buat matriks konfusi

# Combine predictions and truth values
pred_combined <- predictions %>% 
   mutate(true_class = test_data$outcome)

pred_combined
  .pred_class  true_class
  <fct>        <fct>     
1 no           no        
2 no           yes       
3 no           no        
4 yes          yes
# Calculate the confusion matrix
conf_mat(data = pred_combined,

estimate = .pred_class,
truth = true_class)
             Truth
Prediction    no   yes
        no   116    31
       yes    12    40
Machine Learning dengan Model Berbasis Pohon di R

Akurasi

  $$\text{accuracy} = \frac{\text{jml prediksi benar}}{\text{jml seluruh prediksi}}$$

  • Nama fungsi: accuracy()
  • Argumen sama seperti conf_mat()
    • data, estimate dan truth
    • Struktur umum di yardstick
accuracy(pred_combined,
         estimate = .pred_class,
         truth = true_class)
  .metric     .estimate
  <chr>           <dbl>
1 accuracy        0.708
Machine Learning dengan Model Berbasis Pohon di R

Mari evaluasi!

Machine Learning dengan Model Berbasis Pohon di R

Preparing Video For Download...