Optimisation des hyperparamètres avec caret

Optimisation des hyperparamètres en R

Dr. Shirin Elsinghorst

Senior Data Scientist

Réglage automatique des hyperparamètres avec caret

Random Forest 

...

Résultats du rééchantillonnage selon les hyperparamètres :

  mtry  Accuracy   Kappa    
   2    0.9006783  0.8015924
   6    0.9126645  0.8253289
  10    0.8999389  0.7999386

L’accuracy a été utilisée pour sélectionner le meilleur modèle (valeur la plus élevée).
La valeur finale utilisée pour le modèle est mtry = 6.
Optimisation des hyperparamètres en R

Les hyperparamètres dépendent des algorithmes

Optimisation des hyperparamètres en R

Hyperparamètres dans les SVM (Support Vector Machines)

fitControl <- trainControl(method = "repeatedcv", number = 3, repeats = 5)

tic()
svm_model <- train(diagnosis ~ ., 
                   data = bc_train_data, 
                   method = "svmPoly", 
                   trControl = fitControl,
                   verbose= FALSE)
toc()
3.836 sec elapsed
Optimisation des hyperparamètres en R

Hyperparamètres dans les SVM (Support Vector Machines)

svm_model
Support Vector Machines with Polynomial Kernel 
... 

Résultats du rééchantillonnage selon les hyperparamètres :

  degree  scale  C     Accuracy   Kappa    
  1       0.100  1.00  0.9104803  0.8211459

L’accuracy a été utilisée pour sélectionner le meilleur modèle (valeur la plus élevée).
Les valeurs finales du modèle sont degree = 1, scale = 0.1 et C = 1.
Optimisation des hyperparamètres en R

Définir les hyperparamètres pour l’optimisation automatique

  • tuneLength
tic()
set.seed(42)
svm_model_2 <- train(diagnosis ~ ., 
                     data = bc_train_data, 
                     method = "svmPoly", 
                     trControl = fitControl,
                     verbose = FALSE,
                     tuneLength = 5)
toc()
7.458 sec elapsed

L’accuracy a été utilisée pour sélectionner le meilleur modèle (valeur la plus élevée).
Les valeurs finales du modèle sont degree = 1, scale = 1 et C = 1.
Optimisation des hyperparamètres en R

Réglage manuel des hyperparamètres avec caret

  • tuneGrid + expand.grid
hyperparams <- expand.grid(degree = 4, scale = 1, C = 1)

tic() set.seed(42) svm_model_3 <- train(diagnosis ~ ., data = bc_train_data, method = "svmPoly", trControl = fitControl, tuneGrid = hyperparams, verbose = FALSE) toc()
0.691 sec elapsed
Optimisation des hyperparamètres en R

Réglage manuel des hyperparamètres avec caret

svm_model_3
Support Vector Machines with Polynomial Kernel 

...

  Accuracy   Kappa   
  0.7772947  0.554812

Le paramètre d’optimisation « degree » a été maintenu à 4.
Le paramètre d’optimisation « scale » a été maintenu à 1.
Le paramètre d’optimisation « C » a été
maintenu à 1.
Optimisation des hyperparamètres en R

C’est à vous !

Optimisation des hyperparamètres en R

Preparing Video For Download...