Modelprestaties evalueren

Marketinganalyse: klantverloop voorspellen in Python

Mark Peterson

Director of Data Science, Infoblox

Nauwkeurigheid

  • Mogelijke maatstaf: nauwkeurigheid
    • Aantal correcte voorspellingen / totaal aantal datapunten
  • Welke data gebruik je?
    • Trainingsdata zijn niet representatief voor nieuwe data
Marketinganalyse: klantverloop voorspellen in Python

Trainings- en testsets

  • Fit je classifier op de trainingsset
  • Maak voorspellingen met de testset
Marketinganalyse: klantverloop voorspellen in Python

Trainings- en testsets met scikit-learn

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(telco['data'], telco['target'], test_size=0.2, random_state = 42)
from sklearn.svm import SVC svc = SVC() svc.fit(X_train, y_train) svc.predict(X_test)
Marketinganalyse: klantverloop voorspellen in Python

Nauwkeurigheid berekenen

svc.score(X_test, y_test)
0.857
  • 85,7% nauwkeurigheid: best goed voor een eerste poging!
Marketinganalyse: klantverloop voorspellen in Python

Je model verbeteren

  • Overfitting: model past te nauw op de trainingsdata
  • Underfitting: vangt trends in de trainingsdata niet
  • Zoek de juiste balans tussen over- en underfitting
Marketinganalyse: klantverloop voorspellen in Python

Laten we oefenen!

Marketinganalyse: klantverloop voorspellen in Python

Preparing Video For Download...