Algoritme deteksi penipuan dalam praktik

Deteksi Kecurangan di Python

Charlotte Werger

Data Scientist

Deteksi penipuan tradisional dengan sistem berbasis aturan

Deteksi Kecurangan di Python

Kekurangan penggunaan sistem berbasis aturan

Sistem berbasis aturan memiliki keterbatasan:

  1. Ambang tetap per aturan untuk menentukan penipuan
  2. Terbatas pada hasil ya/tidak
  3. Gagal menangkap interaksi antar fitur
Deteksi Kecurangan di Python

Mengapa gunakan machine learning untuk deteksi penipuan?

  1. Model machine learning beradaptasi dengan data, sehingga dapat berubah seiring waktu
  2. Gunakan seluruh data gabungan, bukan ambang per fitur
  3. Dapat memberi skor, bukan hanya ya/tidak
  4. Biasanya berkinerja lebih baik dan dapat digabung dengan aturan

Deteksi Kecurangan di Python

Pengingat singkat tentang model machine learning

from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn import metrics

# Step 1: split your features and labels into train and test data X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# Step 2: Define which model you want to use model = LinearRegression()
# Step 3: Fit the model to your training data model.fit(X_train, y_train)
# Step 4: Obtain model predictions from your test data y_predicted = model.predict(X_test)
# Step 5: Compare y_test to predictions and obtain performance metrics print (metrics.r2_score(y_test, y_predicted))
0.821206237313
Deteksi Kecurangan di Python

Apa yang akan Anda lakukan di bab berikutnya

  • Bab 2. Pembelajaran terawasi: latih model dengan label penipuan yang ada

  • Bab 3. Pembelajaran tak terawasi: gunakan data Anda untuk menentukan perilaku “mencurigakan” tanpa label

  • Bab 4. Deteksi penipuan dengan data teks: pelajari cara memperkuat model deteksi penipuan dengan text mining dan topic modeling

Deteksi Kecurangan di Python

Ayo berlatih!

Deteksi Kecurangan di Python

Preparing Video For Download...