Ensembles en hyperparametertuning

CTR voorspellen met Machine Learning in Python

Kevin Huo

Instructor

Ensemblemethoden

Voorbeeld van bootstrap-aggregatie

  • Bagging: willekeurige steekproeven voor verschillende modellen; modellen apart trainen en vervolgens combineren.
CTR voorspellen met Machine Learning in Python

Random forests

clf = RandomForestClassifier()
print(clf)
RandomForestClassifier(
  bootstrap=True,
  ...
  max_depth = 10,
  ...
  n_estimators = 100,
  ...)
CTR voorspellen met Machine Learning in Python

Hyperparametertuning

  • Hyperparameter: instellingen voorafgaand aan training, extern aan het model
  • Voorbeelden van parameters maar GEEN hyperparameters: hellingscoëfficiënt in lineaire regressie, gewichten in logistische regressie, enz.
  • Voorbeelden van hyperparameters: max_depth, n_estimators, enz.
CTR voorspellen met Machine Learning in Python

Grid search

param_grid = {'n_estimators': n_estimators, 
              'max_depth': max_depth}
clf = GridSearchCV(estimator = model, 
                   param_grid = param_grid, 
                   scoring = 'roc_auc')
print(clf.best_score_)
print(clf.best_estimator_)
0.6777
RandomForestClassifier(max_depth = 100, ...)
CTR voorspellen met Machine Learning in Python

Laten we oefenen!

CTR voorspellen met Machine Learning in Python

Preparing Video For Download...