Menandai penipuan vs non-penipuan

Deteksi Kecurangan di Python

Charlotte Werger

Data Scientist

Mulai dengan data berkelompok

Deteksi Kecurangan di Python

Tetapkan centroid klaster

Deteksi Kecurangan di Python

Hitung jarak dari centroid klaster

Deteksi Kecurangan di Python

Tandai fraud yang paling jauh dari centroid

Deteksi Kecurangan di Python

Menandai fraud berdasar jarak ke centroid

# Run the kmeans model on scaled data
kmeans = KMeans(n_clusters=6, random_state=42).fit(X_scaled)

# Get the cluster number for each datapoint X_clusters = kmeans.predict(X_scaled)
# Save the cluster centroids X_clusters_centers = kmeans.cluster_centers_
# Calculate the distance to the cluster centroid for each point dist = [np.linalg.norm(x-y) for x,y in zip(X_scaled, X_clusters_centers[X_clusters])]
# Create predictions based on distance km_y_pred = np.array(dist) km_y_pred[dist>=np.percentile(dist, 93)] = 1 km_y_pred[dist<np.percentile(dist, 93)] = 0
Deteksi Kecurangan di Python

Validasi hasil model

  • Verifikasi dengan analis fraud
  • Selidiki dan jelaskan kasus yang ditandai lebih rinci
  • Bandingkan dengan kasus fraud terdahulu
Deteksi Kecurangan di Python

Ayo berlatih!

Deteksi Kecurangan di Python

Preparing Video For Download...