Ensemblemethoden

Fraudedetectie in Python

Charlotte Werger

Data Scientist

Wat zijn ensemblemethoden: bagging versus stacking

Fraudedetectie in Python

Stacking-ensembles

Fraudedetectie in Python

Waarom ensembles voor fraudedetectie

Ensemblemethoden:

  • Zijn robuust
  • Helpen overfitting voorkomen
  • Verbeteren vaak de voorspellingsprestatie
  • Winnen vaak prestigieuze Kaggle-wedstrijden
Fraudedetectie in Python

Voting Classifier

from sklearn.ensemble import VotingClassifier

clf1 = LogisticRegression(random_state=1) clf2 = RandomForestClassifier(random_state=1) clf3 = GaussianNB()
ensemble_model = VotingClassifier(estimators=[('lr', clf1), ('rf', clf2), ('gnb', clf3)], voting='hard')
ensemble_model.fit(X_train, y_train) ensemble_model.predict(X_test)
VotingClassifier(estimators=[('lr', clf1), ('rf', clf2), ('gnb', clf3)], voting='soft', weights=[2,1,1])
Fraudedetectie in Python

Betrouwbare labels voor fraudedetectie

Fraudedetectie in Python

Laten we oefenen!

Fraudedetectie in Python

Preparing Video For Download...