Metodi ensemble

Rilevamento delle frodi in Python

Charlotte Werger

Data Scientist

Cosa sono gli ensemble: bagging vs stacking

Stacking negli ensemble

Perché usare gli ensemble per il fraud detection

I metodi ensemble:

Sono robusti
Aiutano a evitare l’overfitting
Di solito migliorano le prestazioni predittive
Vincono spesso le competizioni Kaggle

Voting classifier

from sklearn.ensemble import VotingClassifier

clf1 = LogisticRegression(random_state=1)
clf2 = RandomForestClassifier(random_state=1)
clf3 = GaussianNB()

ensemble_model = VotingClassifier(estimators=[('lr', clf1),
('rf', clf2), ('gnb', clf3)], voting='hard')

ensemble_model.fit(X_train, y_train)
ensemble_model.predict(X_test)

VotingClassifier(estimators=[('lr', clf1), ('rf', clf2), 
('gnb', clf3)], voting='soft', weights=[2,1,1])

Etichette affidabili per il fraud detection

Passiamo alla pratica!

Rilevamento delle frodi in Python