Tahmin et ve değerlendir

R ile Ağaç Tabanlı Modellerle Machine Learning

Sandro Raabe

Data Scientist

Yeni veride tahmin

Genel çağrı:
predict(model, new_data, type)
Argümanlar:
  1. Eğitilmiş model
  2. Tahmin yapılacak veri kümesi
  3. Tahmin türü: etiket veya olasılık
R ile Ağaç Tabanlı Modellerle Machine Learning

Yeni veride tahmin

predict(model, new_data = test_data, 
               type = "class")
  .pred_class
  <fct>      
1 no         
2 no         
3 yes        
4 no
predict(model, new_data = test_data, 
               type = "prob")
     .pred_no  .pred_yes
     <dbl>     <dbl>
1    0.866     0.134
2    0.956     0.044
3    0.672     0.328
4    0.877     0.123
R ile Ağaç Tabanlı Modellerle Machine Learning

Karışıklık matrisi

karışıklık_matrisi_1

  • Modelin ne kadar şaşırdığını gösterir
R ile Ağaç Tabanlı Modellerle Machine Learning

Karışıklık matrisi

karışıklık_matrisi_2

R ile Ağaç Tabanlı Modellerle Machine Learning

Karışıklık matrisi

karışıklık_matrisi_3

R ile Ağaç Tabanlı Modellerle Machine Learning

Karışıklık matrisi

karışıklık_matrisi_4

  • Diyagonal: doğru tahminler
  • Diyagonal dışı: yanlış tahminler
R ile Ağaç Tabanlı Modellerle Machine Learning

Karışıklık matrisi

 

  • TP: tahmin evet, gerçek evet
  • TN: tahmin hayır, gerçek hayır
  • FP: tahmin evet, gerçek hayır
  • FN: tahmin hayır, gerçek evet

karışıklık_matrisi_4

R ile Ağaç Tabanlı Modellerle Machine Learning

Karışıklık matrisini oluşturun

# Tahminler ve gerçek değerleri birleştirin
pred_combined <- predictions %>% 
   mutate(true_class = test_data$outcome)

pred_combined
  .pred_class  true_class
  <fct>        <fct>     
1 no           no        
2 no           yes       
3 no           no        
4 yes          yes
# Karışıklık matrisini hesaplayın
conf_mat(data = pred_combined,

estimate = .pred_class,
truth = true_class)
             Truth
Prediction    no   yes
        no   116    31
       yes    12    40
R ile Ağaç Tabanlı Modellerle Machine Learning

Doğruluk (accuracy)

  $$\text{accuracy} = \frac{\text{doğru tahmin sayısı}}{\text{toplam tahmin sayısı}}$$

  • Fonksiyon adı: accuracy()
  • conf_mat() ile aynı argümanlar
    • data, estimate ve truth
    • yardstick içinde ortak yapı
accuracy(pred_combined,
         estimate = .pred_class,
         truth = true_class)
  .metric     .estimate
  <chr>           <dbl>
1 accuracy        0.708
R ile Ağaç Tabanlı Modellerle Machine Learning

Haydi değerlendirelim!

R ile Ağaç Tabanlı Modellerle Machine Learning

Preparing Video For Download...