Modellen vergelijken

Machine Learning met caret in R

Zach Mayer

Data Scientist at DataRobot and co-author of caret

Modellen vergelijken

  • Zorg dat ze op dezelfde data zijn getraind!
  • Selectiecriteria
    • Hoogste gemiddelde AUC
    • Laagste standaarddeviatie van AUC
  • De functie resamples() helpt je hierbij
Machine Learning met caret in R

Voorbeeld: resamples() op churn-data

# Make a list
model_list <- list(
  glmnet = model_glmnet,
  rf = model_rf
)
# Collect resamples from the CV folds
resamps <- resamples(model_list)
resamps
Call:
resamples.default(x = model_list)

Models: glmnet, rf 
Number of resamples: 5 
Performance metrics: ROC, Sens, Spec 
Time estimates for: everything, final model fit 
Machine Learning met caret in R

Resultaten samenvatten

# Summarize the results
summary(resamps)
Call:
summary.resamples(object = resamps)

Models: glmnet, rf 
Number of resamples: 5 

ROC 
         Min. 1st Qu. Median   Mean 3rd Qu.   Max. NA's
glmnet 0.7526  0.7624 0.7719 0.7686  0.7722 0.7840    0
rf     0.8984  0.9028 0.9077 0.9061  0.9093 0.9125    0
Machine Learning met caret in R

Laten we oefenen!

Machine Learning met caret in R

Preparing Video For Download...