Alberi bagged

Machine Learning con modelli ad albero in R

Sandro Raabe

Data Scientist

Meglio molte teste che una

la saggezza della folla

Machine Learning con modelli ad albero in R

Bootstrap e aggregazione

  • Bagging = abbreviazione di Bootstrap Aggregation

 

 1. Bootstrapping

  • Campionamento con reinserimento $\rightarrow$ molti training set modificati

 

 2. Aggregation

  • Le previsioni dei modelli sono combinate per la previsione finale:
    • Media (regressione)
    • Maggioranza (classificazione)
Machine Learning con modelli ad albero in R

Passo 1: Bootstrap e training

schema del bootstrapping

Machine Learning con modelli ad albero in R

Passo 2: Aggrega

aggregheremo i risultati

Machine Learning con modelli ad albero in R

Coding: specifica gli alberi bagged

library(baguette)
spec_bagged <- bag_tree() %>%

set_mode("classification") %>%
set_engine("rpart", times = 100)
Specifiche del modello ad albero decisionale bagged (classificazione)

Argomenti principali:
  cost_complexity = 0
  min_n = 2

Argomenti specifici del motore:
  times = 100

Motore computazionale: rpart
Machine Learning con modelli ad albero in R

Allena tutti gli alberi

model_bagged <- fit(spec_bagged, formula = still_customer ~ ., data = customers_train)
oggetto modello parsnip

Tempo di fit: 23,9 s

CART bagged (classificazione con 100 membri)
Punteggi di importanza delle variabili: # A tibble: 19 x 4 term value std.error used <chr> <dbl> <dbl> <int> 1 total_trans_ct 876. 3.93 100 2 total_trans_amt 800. 4.54 100 3 total_revolving_bal 491. 3.67 100
Machine Learning con modelli ad albero in R

Facciamo bootstrap!

Machine Learning con modelli ad albero in R

Preparing Video For Download...