Modelevaluatie: ongebalanceerde classificatiemodellen

Machine Learning-sollicitatievragen oefenen in Python

Lisa Stuart

Data Scientist

Klasonbalans

  • Categorische targetvariabele
    • Ongeveer evenveel observaties per klasse
    • Grote verschillen -> misleidende resultaten

Ongebalanceerde vs. gebalanceerde klassen

Machine Learning-sollicitatievragen oefenen in Python

Confusion matrix

Confusion matrix

1 https://scaryscientist.blogspot.com/2016/03/confusion-matrix.html
Machine Learning-sollicitatievragen oefenen in Python

Prestatiemetrics

Prestatiemetrics

1 https://scaryscientist.blogspot.com/2016/03/confusion-matrix.html
Machine Learning-sollicitatievragen oefenen in Python

Metrics uit de matrix

Prestatiemetrics

1 https://scaryscientist.blogspot.com/2016/03/confusion-matrix.html
Machine Learning-sollicitatievragen oefenen in Python

Resamplingtechnieken

  • Oversample minderheidsklasse
  • Undersample meerderheidsklasse
  • LET OP: eerst train/test splitsen vóór resampling!

Resamplingtechnieken

1 https://www.svds.com/learning-imbalanced-classes/
Machine Learning-sollicitatievragen oefenen in Python

Functies

Functie retourneert
sklearn.linear_model.LogisticRegression logistische regressie
sklearn.metrics.confusion_matrix(y_test,y_pred) confusion matrix
sklearn.metrics.precision_score(y_test,y_pred) precisie
sklearn.metrics.recall_score(y_test,y_pred) recall
sklearn.metrics.f1_score(y_test,y_pred) f1-score
sklearn.utils.resample(deny, n_samples=len(approve)) resampled
Machine Learning-sollicitatievragen oefenen in Python

Laten we oefenen!

Machine Learning-sollicitatievragen oefenen in Python

Preparing Video For Download...