Re-muestreo adaptativo

Ajuste de hiperparámetros en R

Dr. Shirin Elsinghorst

Senior Data Scientist

¿Qué es el re-muestreo adaptativo?

Búsqueda en rejilla

  • Se calculan todas las combinaciones de hiperparámetros.

Búsqueda aleatoria

  • Se calculan subconjuntos aleatorios de combinaciones.

→ La mejor combinación se evalúa al final.

Re-muestreo adaptativo

  • Se re-muestrean combinaciones cercanas a las que funcionaron bien.
  • Por tanto, el re-muestreo adaptativo es más rápido y eficiente.

"Futility Analysis in the Cross-Validation of Machine Learning Models." Max Kuhn; ARXIV 2014

Ajuste de hiperparámetros en R

Re-muestreo adaptativo en caret

trainControl: method = "adaptive_cv" + search = "random" + adaptive =

  • min: número mínimo de re-muestras por hiperparámetro

  • alpha: nivel de confianza para descartar hiperparámetros

  • method: "gls" para modelo lineal o "BT" para Bradley-Terry

  • complete: si TRUE genera el conjunto completo de re-muestreo

fitControl <- trainControl(method = "adaptive_cv",
                             adaptive = list(min = 2, alpha = 0.05, 
                                             method = "gls", complete = TRUE),
                             search = "random")
Ajuste de hiperparámetros en R
  • trainControl() + tuneLength = x
fitControl <- trainControl(method = "adaptive_cv", number = 3, repeats = 3,
                           adaptive = list(min = 2, 
                                           alpha = 0.05, 
                                           method = "gls", 
                                           complete = TRUE),
                             search = "random")

tic() set.seed(42) gbm_model_voters_adaptive <- train(turnout16_2016 ~ ., data = voters_train_data, method = "gbm", trControl = fitControl, verbose = FALSE, tuneLength = 7) toc()
1239.837 sec elapsed
Ajuste de hiperparámetros en R

Re-muestreo adaptativo

gbm_model_voters_adaptive
...
Resultados de re-muestreo con hiperparámetros:
  shrinkage   interaction.depth  n.minobsinnode  n.trees  Accuracy   Kappa       Resamples
  0.07137493   5                  6              4152     0.9564654  0.02856571  9        
  0.08408739   5                 14               674     0.9547185  0.02098853  4        
  0.28552325   8                 15              3209     0.9568141  0.03024238  3        
  0.33663932  10                 13              2595     0.9571130  0.04250979  9        
  0.54251480   3                 24              3683     0.9482171  0.03568586  2        
  0.56406870   7                 25              4685     0.9549898  0.05284333  5        
  0.58695763   8                 24              1431     0.9520286  0.02742592  2        
Se usó Accuracy para seleccionar el mejor modelo con el mayor valor.
Los valores finales del modelo fueron n.trees = 2595,
interaction.depth = 10, shrinkage = 0.3366393 y n.minobsinnode = 13.
Ajuste de hiperparámetros en R

¡Manos al código!

Ajuste de hiperparámetros en R

Preparing Video For Download...