Een trainControl hergebruiken

Machine Learning met caret in R

Max Kuhn

Software Engineer at RStudio and creator of caret

Een praktijkvoorbeeld

  • Data: klantverloop bij telecombedrijf
  • Pas verschillende modellen toe en kies de beste
  • Modellen moeten dezelfde train/test-splits gebruiken
  • Maak één gedeeld trainControl-object
Machine Learning met caret in R

Voorbeeld: klantverloopdata

# Summarize the target variables
library(caret)
library(C50)
data(churn)
table(churnTrain$churn) / nrow(churnTrain)
      yes        no 
0.1449145 0.8550855 
Machine Learning met caret in R

Voorbeeld: klantverloopdata

# Create train/test indexes
set.seed(42)
myFolds <- createFolds(churnTrain$churn, k = 5)
# Compare class distribution
i <- myFolds$Fold1
table(churnTrain$churn[i]) / length(i)
      yes        no 
0.1441441 0.8558559
Machine Learning met caret in R

Voorbeeld: klantverloopdata

myControl <- trainControl(
  summaryFunction = twoClassSummary,
  classProbs = TRUE,
  verboseIter = TRUE,
  savePredictions = TRUE,
  index = myFolds
)
  • Gebruik folds om een trainControl-object te maken
  • Exact dezelfde cross-validatiefolds voor elk model
Machine Learning met caret in R

Laten we oefenen!

Machine Learning met caret in R

Preparing Video For Download...