Assegnare frode vs non frode

Rilevamento delle frodi in Python

Charlotte Werger

Data Scientist

Partire da dati clusterizzati

Rilevamento delle frodi in Python

Assegna i centroidi dei cluster

Rilevamento delle frodi in Python

Definisci le distanze dal centroide del cluster

Rilevamento delle frodi in Python

Segnala frodi per i punti più lontani dal centroide

Rilevamento delle frodi in Python

Segnalare frodi in base alla distanza dal centroide

# Run the kmeans model on scaled data
kmeans = KMeans(n_clusters=6, random_state=42).fit(X_scaled)

# Get the cluster number for each datapoint X_clusters = kmeans.predict(X_scaled)
# Save the cluster centroids X_clusters_centers = kmeans.cluster_centers_
# Calculate the distance to the cluster centroid for each point dist = [np.linalg.norm(x-y) for x,y in zip(X_scaled, X_clusters_centers[X_clusters])]
# Create predictions based on distance km_y_pred = np.array(dist) km_y_pred[dist>=np.percentile(dist, 93)] = 1 km_y_pred[dist<np.percentile(dist, 93)] = 0
Rilevamento delle frodi in Python

Validare i risultati del modello

  • Confrontati con l'analista antifrode
  • Indaga e descrivi meglio i casi segnalati
  • Confronta con casi di frode noti in passato
Rilevamento delle frodi in Python

Let's practice!

Rilevamento delle frodi in Python

Preparing Video For Download...