Prediksi CTR dengan pohon keputusan

Memprediksi CTR dengan Machine Learning di Python

Kevin Huo

Instructor

Pohon keputusan

Contoh pohon keputusan yang menentukan pinjaman kredit berdasarkan usia dan status mahasiswa

  • Node merepresentasikan fitur
  • Cabang merepresentasikan keputusan berdasarkan fitur
  • Contoh hasil ditampilkan pada tabel di bawah:
  • Pemisahan pertama berdasarkan usia pemohon
  • Untuk kelompok muda, pemisahan kedua berdasarkan status mahasiswa
  • Model memberi heuristik untuk pemahaman
is_student loan
middle_aged 1
youth no 0
youth yes 1
Memprediksi CTR dengan Machine Learning di Python

Melatih dan menguji model

  • Buat dengan: clf = DecisionTreeClassifier()
  • Mirip regresi logistik, pohon keputusan juga memakai clf.fit(X_train, y_train) untuk pelatihan dan clf.predict(X_test) untuk label uji:

    array([0, 1, 1, ..., 1, 0, 1])
    
  • clf.predict_proba(X_test) untuk skor probabilitas:

    array([0.2, 0.8], [0.4, 0.6] ..., [0.1, 0.9] [0.3, 0.7]])
    
  • Contoh membagi data latih-uji acak, data uji 30% dari total sampel: train_test_split(X, y, test_size = .3, random_state = 0)

Memprediksi CTR dengan Machine Learning di Python

Evaluasi dengan kurva ROC

Contoh area di bawah kurva ROC untuk sebuah pengklasifikasi

  • True positive rate (sumbu-Y) = #(klasifier prediksi positif, sebenarnya positif) / #(positif)
  • False positive rate (sumbu-X) = #(klasifier prediksi positif, sebenarnya negatif) / #(negatif)
  • Garis biru putus-putus: AUC baseline 0,5
  • Inginkan garis oranye (AUC) sedekat mungkin dengan 1
Memprediksi CTR dengan Machine Learning di Python

AUC dari kurva ROC

Y_score = clf.predict_proba(X_test)
fpr, tpr, thresholds = roc_curve(Y_test, Y_score[:, 1])
  • Input roc_curve(): array uji dan skor
roc_auc = auc(fpr, tpr)
  • Input auc(): array false-positive dan true-positive

  • Jika model akurat dan CTR rendah, pertimbangkan ulang pesan iklan dan target audiens

Memprediksi CTR dengan Machine Learning di Python

Ayo berlatih!

Memprediksi CTR dengan Machine Learning di Python

Preparing Video For Download...