Riutilizzare un trainControl

Machine Learning con caret in R

Max Kuhn

Software Engineer at RStudio and creator of caret

Un esempio reale

  • Dati: churn clienti in una telco
  • Allena modelli diversi e scegli il migliore
  • Stessi split train/test per tutti i modelli
  • Crea un unico oggetto trainControl condiviso
Machine Learning con caret in R

Esempio: dati di churn clienti

# Riassumi la variabile target
library(caret)
library(C50)
data(churn)
table(churnTrain$churn) / nrow(churnTrain)
      yes        no 
0.1449145 0.8550855 
Machine Learning con caret in R

Esempio: dati di churn clienti

# Crea indici train/test
set.seed(42)
myFolds <- createFolds(churnTrain$churn, k = 5)
# Confronta la distribuzione delle classi
i <- myFolds$Fold1
table(churnTrain$churn[i]) / length(i)
      yes        no 
0.1441441 0.8558559
Machine Learning con caret in R

Esempio: dati di churn clienti

myControl <- trainControl(
  summaryFunction = twoClassSummary,
  classProbs = TRUE,
  verboseIter = TRUE,
  savePredictions = TRUE,
  index = myFolds
)
  • Usa i fold per creare un oggetto trainControl
  • Stessi fold di cross-validation per ogni modello
Machine Learning con caret in R

Passons à la pratique !

Machine Learning con caret in R

Preparing Video For Download...