Andere modelmetrics

Marketinganalyse: klantverloop voorspellen in Python

Mark Peterson

Director of Data Science, Infoblox

Kansdrempels

  • Elke voorspelling van je classifier heeft een bijbehorende kans
  • Standaard drempel in scikit-learn: 50%

 

  • Wat als we deze drempel variëren?
Marketinganalyse: klantverloop voorspellen in Python

ROC-curve deel 1

Marketinganalyse: klantverloop voorspellen in Python

ROC-curve deel 2

Marketinganalyse: klantverloop voorspellen in Python

ROC-curve deel 3

Marketinganalyse: klantverloop voorspellen in Python

ROC-curve deel 4

Marketinganalyse: klantverloop voorspellen in Python

ROC-curve deel 5

Marketinganalyse: klantverloop voorspellen in Python

ROC-curve deel 6

Marketinganalyse: klantverloop voorspellen in Python

ROC-curve deel 7

Marketinganalyse: klantverloop voorspellen in Python

ROC-curve deel 8

Marketinganalyse: klantverloop voorspellen in Python

Kansen genereren in sklearn

logreg.predict_proba(X_test)[:,1]
array([[0.80188981, 0.19811019],
       [0.96484075, 0.03515925],
       [0.9182671 , 0.0817329 ],
       ...,
y_pred_prob = logreg.predict_proba(X_test)[:,1]
Marketinganalyse: klantverloop voorspellen in Python

ROC-curve in sklearn

from sklearn.metrics import roc_curve

fpr, tpr, thresholds = roc_curve(y_test, y_pred_prob)
import matplotlib.pyplot as plt

plt.plot(fpr, tpr)

plt.xlabel("False Positive Rate")

plt.ylabel("True Positive Rate")

plt.plot([0, 1], [0, 1], "k--")

plt.show()
Marketinganalyse: klantverloop voorspellen in Python

Oppervlakte onder de curve

from sklearn.metrics import roc_auc_score

auc = roc_auc_score(y_test, y_pred)
Marketinganalyse: klantverloop voorspellen in Python

Laten we oefenen!

Marketinganalyse: klantverloop voorspellen in Python

Preparing Video For Download...