Metriche di performance per alberi di regressione

Machine Learning con modelli ad albero in R

Sandro Raabe

Data Scientist

Come misurare la performance?

  • Problemi di classificazione: accuratezza (matrice di confusione)
  • Problemi di regressione: "correttezza" relativa, niente esito binario

$\Rightarrow$ Misura quanto le previsioni si discostano dalla verità

Machine Learning con modelli ad albero in R

Metriche comuni per la regressione

  • Errore assoluto medio (MAE)
  • Radice dell'errore quadratico medio (RMSE)

 

Intuizione MAE:

grafico delle differenze medie

 

 

 

 

 

MAE = lunghezza media delle barre rosse

Machine Learning con modelli ad albero in R

Formule e intuizioni

 

$$MAE = \frac{1}{n} \sum_{i=1}^n\left| actual_i - predicted_i \right|$$

 

  • "Somma delle deviazioni assolute divisa per il numero di previsioni"

$$\quad MSE = \quad \frac{1}{n} \sum_{i=1}^n\left( actual_i - predicted_i \right)^2$$

  •                   "Errore quadratico medio"
Machine Learning con modelli ad albero in R

Formule e intuizioni

 

$$MAE = \frac{1}{n} \sum_{i=1}^n\left| actual_i - predicted_i \right|$$

 

  • "Somma delle deviazioni assolute divisa per il numero di previsioni"

$$RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^n\left( actual - predicted \right)^2}$$

  • "Radice dell'errore quadratico medio"
  • Gli errori grandi pesano di più
Machine Learning con modelli ad albero in R

Coding: previsioni

# parsnip e yardstick sono inclusi in tidymodels
library(tidymodels)
# Fai previsioni e aggiungile ai dati di test
predictions <- predict(model, new_data = chocolate_test) %>%

bind_cols(chocolate_test)
# A tibble: 358 x 7
   .pred final_grade review_date cocoa_percent company_location
   <dbl>       <dbl>       <int>         <dbl> <fct>           
 1  2.5         2.75        2013          0.7  France          
 2  3.64        3.25        2014          0.8  France          
 3  3.3         3.5         2012          0.7  France          
 4  3.25        3.5         2011          0.72 Fiji            
# ... con altre 354 righe e 2 variabili in più: bean_type <fct>, broad_bean_origin <fct>
Machine Learning con modelli ad albero in R

Coding: mae() e rmse()

# Valuta con mae()
mae(predictions,

estimate = .pred,
truth = final_grade)
# A tibble: 1 x 2
  .metric   .estimate
  <chr>         <dbl>
1 mae           0.363
# Valuta con rmse()
rmse(predictions,
     estimate = .pred,
     truth = final_grade)
# A tibble: 1 x 2
  .metric   .estimate
  <chr>         <dbl>
1 rmse          0.457
Machine Learning con modelli ad albero in R

Valutiamo!

Machine Learning con modelli ad albero in R

Preparing Video For Download...