Modellen afstemmen

CTR voorspellen met Machine Learning in Python

Kevin Huo

Instructor

Regularisatie

Voorbeeld van regularisatie met blauwe en groene lijn

  • Regularisatie: overfitting tegengaan door de grootte van modelcoëfficiënten aan te passen
  • Regularisatie kan metrics en daarmee de ROI op advertentiebudget verhogen
CTR voorspellen met Machine Learning in Python

Voorbeelden van regularisatie

  • Logistische regressie: de parameter C is de inverse van de regularisatiesterkte.
  • Van minst naar meest complex: C=0.05 < C=0.5 < C=1
  • Beslisboom: de parameter max_depth bepaalt hoeveel lagen de boom mag hebben.
  • Van minst naar meest complex: max_depth=3 < max_depth=5 < max_depth=10
CTR voorspellen met Machine Learning in Python

Cross-validatie

K-voudige cross-validatie

  • Voor elk van de k folds wordt die fold gebruikt als testset (validatie), de andere k-1 als trainingsset.
  • Je krijgt dus k beoordelingen van modelprestatie.
  • Let op: je hebt nog steeds een aparte testset voor eindbeoordeling.
CTR voorspellen met Machine Learning in Python

Voorbeelden van cross-validatie

k_fold = KFold(n_splits = 4, random_state = 0, shuffle = True)
for i in [3, 5, 10]:
  clf = DecisionTreeClassifier(max_depth = i)
  cv_precision = cross_val_score(
    clf, X_train, y_train, cv = k_fold, 
    scoring = 'precision_weighted')
  • Scoring-strings: precision_weighted, recall_weighted, roc_auc
CTR voorspellen met Machine Learning in Python

Laten we oefenen!

CTR voorspellen met Machine Learning in Python

Preparing Video For Download...