Beslissingsbomen bouwen met het rpart()-pakket

Kredietrisicomodellering in R

Lore Dirick

Manager of Data Science Curriculum at Flatiron School

Stel je voor...

beslissingsboom.gif

Kredietrisicomodellering in R

rpart()-pakket! Maar...

  • Moeilijk om een mooie beslissingsboom te bouwen voor kredietrisico
  • Hoofdreden: ongebalanceerde data
fit_default <- rpart(loan_status ~ ., method = "class", 
                     data = training_set)
plot(fit_default)
Error in plot.rpart(fit_default) : fit is not a tree, just a root
Kredietrisicomodellering in R

Drie technieken tegen onbalans

  • Undersampling of oversampling
    • Nauwkeurigheidsprobleem verdwijnt
    • Alleen op de trainingsset
  • A-priorikansen aanpassen
  • Een verliesmatrix opnemen

Valideer het model om te zien wat werkt!

Kredietrisicomodellering in R

Laten we oefenen!

Kredietrisicomodellering in R

Preparing Video For Download...