Revisione e confronto dei modelli

Prevedere il CTR con il Machine Learning in Python

Kevin Huo

Instructor

Revisione dei modelli

from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.neural_network import MLPClassifier
  • Regressione logistica: classificatore lineare che definisce la boundary di decisione
  • Alberi decisionali: condizioni in formato ad albero
  • Random Forest: insieme di Decision Tree
  • Reti neurali (MLP): layer che usano combinazioni lineari delle feature con funzione di attivazione non lineare
Prevedere il CTR con il Machine Learning in Python

Implementazione dei modelli

Somiglianze
  • Trasformazione delle feature e regolarizzazione
  • Addestramento con classifier.fit(X_train, y_train)
  • Predizioni con predict_proba() e predict()
Differenze
  • Decision Tree: max_depth, min_samples_split
  • Random Forest: n_estimators, oob_score
  • Regressione logistica: fit_intercept, class_weight
  • Reti neurali: hidden_layer_sizes, max_iter
Prevedere il CTR con il Machine Learning in Python

Valutazione dei modelli

  • Metriche chiave di valutazione:
    • Matrice di confusione: confusion_matrix(y_test, y_pred)
    • Precisione: precision_score(y_test, y_pred)
    • Recall: precision_score(y_test, y_pred)
    • F-beta: fbeta_score(y_test, y_pred, beta = 0.5)
    • AUC ROC: roc_auc_score(y_test, y_score[:, 1])
Prevedere il CTR con il Machine Learning in Python

Pro e contro principali delle reti neurali

Pro

  • Scalabilità con i dati
  • Meno bisogno di feature engineering
  • Più trasferibili tra domini

Contro

  • Meno efficaci su dataset piccoli
  • Difficili da interpretare
  • Costosi dal punto di vista computazionale e finanziario
Prevedere il CTR con il Machine Learning in Python

Passons à la pratique !

Prevedere il CTR con il Machine Learning in Python

Preparing Video For Download...