Predici e valuta

Machine Learning con modelli ad albero in R

Sandro Raabe

Data Scientist

Prevedere su nuovi dati

Chiamata generale:
predict(model, new_data, type)
Argomenti:
  1. Modello addestrato
  2. Dati su cui prevedere
  3. Tipo di previsione: etichette o probabilità
Machine Learning con modelli ad albero in R

Prevedere su nuovi dati

predict(model, new_data = test_data, 
               type = "class")
  .pred_class
  <fct>      
1 no         
2 no         
3 yes        
4 no
predict(model, new_data = test_data, 
               type = "prob")
     .pred_no  .pred_yes
     <dbl>     <dbl>
1    0.866     0.134
2    0.956     0.044
3    0.672     0.328
4    0.877     0.123
Machine Learning con modelli ad albero in R

Matrice di confusione

matrice_di_confusione_1

  • Mostra quanto il modello si confonde
Machine Learning con modelli ad albero in R

Matrice di confusione

matrice_di_confusione_2

Machine Learning con modelli ad albero in R

Matrice di confusione

matrice_di_confusione_3

Machine Learning con modelli ad albero in R

Matrice di confusione

matrice_di_confusione_4

  • Diagonale: previsioni corrette
  • Fuori diagonale: previsioni errate
Machine Learning con modelli ad albero in R

Matrice di confusione

 

  • TP: previsione , realtà
  • TN: previsione no, realtà no
  • FP: previsione , realtà no
  • FN: previsione no, realtà

matrice_di_confusione_4

Machine Learning con modelli ad albero in R

Crea la matrice di confusione

# Combine predictions and truth values
pred_combined <- predictions %>% 
   mutate(true_class = test_data$outcome)

pred_combined
  .pred_class  true_class
  <fct>        <fct>     
1 no           no        
2 no           yes       
3 no           no        
4 yes          yes
# Calculate the confusion matrix
conf_mat(data = pred_combined,

estimate = .pred_class,
truth = true_class)
             Truth
Prediction    no   yes
        no   116    31
       yes    12    40
Machine Learning con modelli ad albero in R

Accuratezza

  $$\text{accuracy} = \frac{\text{n. previsioni corrette}}{\text{n. previsioni totali}}$$

  • Nome funzione: accuracy()
  • Stessi argomenti di conf_mat()
    • data, estimate e truth
    • Struttura comune in yardstick
accuracy(pred_combined,
         estimate = .pred_class,
         truth = true_class)
  .metric     .estimate
  <chr>           <dbl>
1 accuracy        0.708
Machine Learning con modelli ad albero in R

Valutiamo!

Machine Learning con modelli ad albero in R

Preparing Video For Download...