Metodi ensemble

Rilevamento delle frodi in Python

Charlotte Werger

Data Scientist

Cosa sono gli ensemble: bagging vs stacking

Rilevamento delle frodi in Python

Stacking negli ensemble

Rilevamento delle frodi in Python

Perché usare gli ensemble per il fraud detection

I metodi ensemble:

  • Sono robusti
  • Aiutano a evitare l’overfitting
  • Di solito migliorano le prestazioni predittive
  • Vincono spesso le competizioni Kaggle
Rilevamento delle frodi in Python

Voting classifier

from sklearn.ensemble import VotingClassifier

clf1 = LogisticRegression(random_state=1) clf2 = RandomForestClassifier(random_state=1) clf3 = GaussianNB()
ensemble_model = VotingClassifier(estimators=[('lr', clf1), ('rf', clf2), ('gnb', clf3)], voting='hard')
ensemble_model.fit(X_train, y_train) ensemble_model.predict(X_test)
VotingClassifier(estimators=[('lr', clf1), ('rf', clf2), ('gnb', clf3)], voting='soft', weights=[2,1,1])
Rilevamento delle frodi in Python

Etichette affidabili per il fraud detection

Rilevamento delle frodi in Python

Passiamo alla pratica!

Rilevamento delle frodi in Python

Preparing Video For Download...