Memprediksi CTR dengan Machine Learning di Python
Kevin Huo
Instructor

| is_student | loan | |
|---|---|---|
| middle_aged | 1 | |
| youth | no | 0 |
| youth | yes | 1 |
clf = DecisionTreeClassifier()Mirip regresi logistik, pohon keputusan juga memakai clf.fit(X_train, y_train) untuk pelatihan dan clf.predict(X_test) untuk label uji:
array([0, 1, 1, ..., 1, 0, 1])
clf.predict_proba(X_test) untuk skor probabilitas:
array([0.2, 0.8], [0.4, 0.6] ..., [0.1, 0.9] [0.3, 0.7]])
Contoh membagi data latih-uji acak, data uji 30% dari total sampel: train_test_split(X, y, test_size = .3, random_state = 0)

Y_score = clf.predict_proba(X_test)
fpr, tpr, thresholds = roc_curve(Y_test, Y_score[:, 1])
roc_curve(): array uji dan skorroc_auc = auc(fpr, tpr)
Input auc(): array false-positive dan true-positive
Jika model akurat dan CTR rendah, pertimbangkan ulang pesan iklan dan target audiens
Memprediksi CTR dengan Machine Learning di Python