Algoritmi di rilevamento frodi in azione

Rilevamento delle frodi in Python

Charlotte Werger

Data Scientist

Rilevamento frodi tradizionale con sistemi basati su regole

Svantaggi dei sistemi basati su regole

I sistemi basati su regole hanno limiti:

Soglie fisse per regola per determinare la frode
Esiti limitati a sì/no
Non colgono le interazioni tra feature

Perché usare il machine learning per rilevare le frodi?

I modelli di ML si adattano ai dati, quindi cambiano nel tempo
Usano tutti i dati combinati invece di una soglia per feature
Forniscono un punteggio, non solo sì/no
In genere performano meglio e si possono combinare con regole

Ripasso sui modelli di machine learning

from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn import metrics

# Step 1: split your features and labels into train and test data 
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Step 2: Define which model you want to use 
model = LinearRegression()

# Step 3: Fit the model to your training data 
model.fit(X_train, y_train)

# Step 4: Obtain model predictions from your test data
y_predicted = model.predict(X_test)

# Step 5: Compare y_test to predictions and obtain performance metrics
print (metrics.r2_score(y_test, y_predicted))

0.821206237313

Cosa farai nei prossimi capitoli

Capitolo 2. Apprendimento supervisionato: allena un modello usando etichette di frode esistenti
Capitolo 3. Apprendimento non supervisionato: usa i tuoi dati per definire comportamenti “sospetti” senza etichette
Capitolo 4. Rilevamento frodi con dati testuali: amplia i modelli con text mining e topic modeling

Passons à la pratique !

Rilevamento delle frodi in Python