Tinjauan metode klasifikasi

Deteksi Kecurangan di Python

Charlotte Werger

Data Scientist

Apa itu klasifikasi?

Tujuan klasifikasi: Gunakan kasus penipuan yang sudah diketahui untuk melatih model agar mengenali kasus baru

Contoh:

  • Email spam/Bukan spam
  • Transaksi online curang: Ya/Tidak
  • Tumor Ganas/Jinak?

Variabel target: $y \in {0,1} $

0: Kelas negatif (kasus normal “mayoritas”)

1: Kelas positif (kasus penipuan “minoritas”)

Deteksi Kecurangan di Python

Metode klasifikasi yang umum untuk deteksi penipuan

  • Regresi logistik

Deteksi Kecurangan di Python

Metode klasifikasi yang umum untuk deteksi penipuan

  • Jaringan saraf

Deteksi Kecurangan di Python

Metode klasifikasi yang umum untuk deteksi penipuan

  • Pohon keputusan
  • Random forest

Deteksi Kecurangan di Python

Pohon keputusan dan random forest

  • Random forest adalah kumpulan pohon pada subset fitur acak

Deteksi Kecurangan di Python

Random forest untuk deteksi penipuan

from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)
predicted = model.predict(X_test)
print (metrics.accuracy_score(y_test, predicted))
0.991324200913242
Deteksi Kecurangan di Python

Ayo berlatih!

Deteksi Kecurangan di Python

Preparing Video For Download...