Revisione e confronto dei modelli

Prevedere il CTR con il Machine Learning in Python

Kevin Huo

Instructor

Revisione dei modelli

from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.neural_network import MLPClassifier
  • Regressione logistica: classificatore lineare che definisce il confine di decisione
  • Alberi decisionali: condizioni in struttura ad albero
  • Random forest: insieme di alberi decisionali
  • Reti neurali (MLP): strati che combinano linearmente le feature con attivazione non lineare
Prevedere il CTR con il Machine Learning in Python

Implementazione del modello

Somiglianze
  • Trasformazione delle feature e regolarizzazione
  • Addestramento con classifier.fit(X_train, y_train)
  • Predizioni con predict_proba() e predict()
Differenze
  • Alberi decisionali: max_depth, min_samples_split
  • Random forest: n_estimators, oob_score
  • Regressione logistica: fit_intercept, class_weight
  • Reti neurali: hidden_layer_sizes, max_iter
Prevedere il CTR con il Machine Learning in Python

Valutazione del modello

  • Metriche chiave di valutazione:
    • Matrice di confusione: confusion_matrix(y_test, y_pred)
    • Precisione: precision_score(y_test, y_pred)
    • Recall: recall_score(y_test, y_pred)
    • F-beta: fbeta_score(y_test, y_pred, beta = 0.5)
    • AUC della ROC: roc_auc_score(y_test, y_score[:, 1])
Prevedere il CTR con il Machine Learning in Python

Pro e contro principali delle reti neurali

Pro

  • Scala bene con i dati
  • Meno necessità di feature engineering
  • Più trasferibile tra domini

Contro

  • Meno potente su dataset piccoli
  • Difficile da interpretare
  • Costi computazionali e finanziari più alti
Prevedere il CTR con il Machine Learning in Python

Let's practice!

Prevedere il CTR con il Machine Learning in Python

Preparing Video For Download...