Uso dei dati testuali

Rilevamento delle frodi in Python

Charlotte Werger

Data Scientist

Spesso incontrerai dati testuali nel rilevamento frodi

Tipi di testo utili:

  1. Email di dipendenti e/o clienti
  2. Descrizioni delle transazioni
  3. Note dei dipendenti
  4. Campo descrizione del modulo di sinistro
  5. Conversazioni telefoniche registrate
  6. ...
Rilevamento delle frodi in Python

Text mining per il rilevamento frodi

  1. Ricerca parole
  2. Analisi del sentiment
  3. Frequenze delle parole e analisi degli argomenti
  4. Stile
Rilevamento delle frodi in Python

Ricerca parole per rilevare frodi

Segnalare parole sospette:

  1. Semplice, diretto e facile da spiegare
  2. Le corrispondenze possono filtrare sopra un modello ML
  3. Le corrispondenze possono essere feature in un modello ML

Rilevamento delle frodi in Python

Conteggi parole per segnalare frodi con pandas

# Using a string operator to find words
df['email_body'].str.contains('money laundering')

# Select data that matches df.loc[df['email_body'].str.contains('money laundering', na=False)]
# Create a list of words to search for list_of_words = ['police', 'money laundering'] df.loc[df['email_body'].str.contains('|'.join(list_of_words) , na=False)]
# Create a fraud flag df['flag'] = np.where((df['email_body'].str.contains('|'.join (list_of_words)) == True), 1, 0)
Rilevamento delle frodi in Python

Passiamo alla pratica!

Rilevamento delle frodi in Python

Preparing Video For Download...