Ottimizzare i modelli

Prevedere il CTR con il Machine Learning in Python

Kevin Huo

Instructor

Regolarizzazione

Esempio di regolarizzazione con linea blu e verde

  • Regolarizzazione: riduce l’overfitting modificando l’ampiezza dei coefficienti del modello
  • Può aumentare le metriche di performance e quindi l’ROI delle campagne
Prevedere il CTR con il Machine Learning in Python

Esempi di regolarizzazione

  • Regressione logistica: il parametro C è l’inverso dell’intensità della regolarizzazione.
  • Da meno a più complesso: C=0.05 < C=0.5 < C=1
  • Albero decisionale: il parametro max_depth controlla quanta profondità può raggiungere l’albero.
  • Da meno a più complesso: max_depth=3 < max_depth=5 < max_depth=10
Prevedere il CTR con il Machine Learning in Python

Cross validation

K-fold cross validation

  • Per ognuna delle k fold, quella fold è il set di test (per validazione) e le altre k-1 sono di training.
  • Ottieni quindi k valutazioni delle performance del modello.
  • C’è comunque un set di test separato per la valutazione finale.
Prevedere il CTR con il Machine Learning in Python

Esempi di cross validation

k_fold = KFold(n_splits = 4, random_state = 0, shuffle = True)
for i in [3, 5, 10]:
  clf = DecisionTreeClassifier(max_depth = i)
  cv_precision = cross_val_score(
    clf, X_train, y_train, cv = k_fold, 
    scoring = 'precision_weighted')
  • Scoring strings: precision_weighted, recall_weighted, roc_auc
Prevedere il CTR con il Machine Learning in Python

Esercitiamoci!

Prevedere il CTR con il Machine Learning in Python

Preparing Video For Download...