Menyetel model

Memprediksi CTR dengan Machine Learning di Python

Kevin Huo

Instructor

Regularisasi

Contoh regularisasi dengan garis biru dan hijau

  • Regularisasi: mengatasi overfitting dengan mengubah besaran koefisien parameter dalam model
  • Regularisasi dapat menaikkan metrik kinerja dan ROI belanja iklan
Memprediksi CTR dengan Machine Learning di Python

Contoh regularisasi

  • Logistic Regression: parameter C adalah kebalikan dari kekuatan regularisasi.
  • Dari paling sederhana ke paling kompleks: C=0.05 < C=0.5 < C=1
  • Decision Tree: parameter max_depth mengatur berapa lapis kedalaman pohon.
  • Dari paling sederhana ke paling kompleks: max_depth=3 < max_depth=5 < max_depth=10
Memprediksi CTR dengan Machine Learning di Python

Cross validation

K-fold cross validation

  • Untuk setiap dari k fold, fold itu dipakai sebagai set uji (validasi) sementara k-1 lainnya untuk pelatihan.
  • Jadi, ada k evaluasi kinerja model.
  • Ingat, Anda tetap memiliki set uji terpisah untuk evaluasi akhir.
Memprediksi CTR dengan Machine Learning di Python

Contoh cross validation

k_fold = KFold(n_splits = 4, random_state = 0, shuffle = True)
for i in [3, 5, 10]:
  clf = DecisionTreeClassifier(max_depth = i)
  cv_precision = cross_val_score(
    clf, X_train, y_train, cv = k_fold, 
    scoring = 'precision_weighted')
  • String penilaian: precision_weighted, recall_weighted, roc_auc
Memprediksi CTR dengan Machine Learning di Python

Ayo berlatih!

Memprediksi CTR dengan Machine Learning di Python

Preparing Video For Download...