Costruire alberi decisionali con il pacchetto rpart()

Credit Risk Modeling in R

Lore Dirick

Manager of Data Science Curriculum at Flatiron School

Immagina...

albero decisionale.gif

Credit Risk Modeling in R

Pacchetto rpart()! Ma...

  • Difficile ottenere un bell’albero per dati di rischio credito
  • Motivo principale: dati sbilanciati
fit_default <- rpart(loan_status ~ ., method = "class", 
                     data = training_set)
plot(fit_default)
Error in plot.rpart(fit_default) : fit is not a tree, just a root
Credit Risk Modeling in R

Tre tecniche per gestire lo sbilanciamento

  • Undersampling o oversampling
    • Il problema di accuratezza sparisce
    • Solo sul training set
  • Modificare le probabilità a priori
  • Includere una loss matrix

Valida il modello per capire cosa funziona meglio!

Credit Risk Modeling in R

Facciamo pratica!

Credit Risk Modeling in R

Preparing Video For Download...