Algoritmi di rilevamento frodi in azione

Rilevamento delle frodi in Python

Charlotte Werger

Data Scientist

Rilevamento frodi tradizionale con sistemi basati su regole

Rilevamento delle frodi in Python

Svantaggi dei sistemi basati su regole

I sistemi basati su regole hanno limiti:

  1. Soglie fisse per regola per determinare la frode
  2. Esiti limitati a sì/no
  3. Non colgono le interazioni tra feature
Rilevamento delle frodi in Python

Perché usare il machine learning per rilevare le frodi?

  1. I modelli di ML si adattano ai dati, quindi cambiano nel tempo
  2. Usano tutti i dati combinati invece di una soglia per feature
  3. Forniscono un punteggio, non solo sì/no
  4. In genere performano meglio e si possono combinare con regole

Rilevamento delle frodi in Python

Ripasso sui modelli di machine learning

from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn import metrics

# Step 1: split your features and labels into train and test data X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# Step 2: Define which model you want to use model = LinearRegression()
# Step 3: Fit the model to your training data model.fit(X_train, y_train)
# Step 4: Obtain model predictions from your test data y_predicted = model.predict(X_test)
# Step 5: Compare y_test to predictions and obtain performance metrics print (metrics.r2_score(y_test, y_predicted))
0.821206237313
Rilevamento delle frodi in Python

Cosa farai nei prossimi capitoli

  • Capitolo 2. Apprendimento supervisionato: allena un modello usando etichette di frode esistenti

  • Capitolo 3. Apprendimento non supervisionato: usa i tuoi dati per definire comportamenti “sospetti” senza etichette

  • Capitolo 4. Rilevamento frodi con dati testuali: amplia i modelli con text mining e topic modeling

Rilevamento delle frodi in Python

Passons à la pratique !

Rilevamento delle frodi in Python

Preparing Video For Download...