Deteksi Fraud di R
Sebastiaan Höppner
PhD researcher in Data Science at KU Leuven
dim(transfer_data)
1000 4
head(transfer_data)
isFraud amount balance ratio
1 false 528.6840 1529.4732 0.3456641
2 false 184.0193 836.3509 0.2200265
3 false 1885.8024 2984.0684 0.6319568
4 false 732.0286 1248.7217 0.5862224
prop.table(table(transfer_data$isFraud))
false true
0.99 0.01


Mari pilih satu kasus fraud X (Tim)

Langkah 1
Temukan K tetangga terdekat
penipuan dari X (Tim)
mis. K = 4

Langkah 2
Pilih acak salah satu tetangga terdekat Tim mis. X4 (Bart)

Langkah 3: buat sampel sintetis

Langkah 3: buat sampel sintetis

Langkah 3: buat sampel sintetis


Langkah 4
Ulangi langkah 1–3 untuk tiap kasus fraud
sebanyak dup_size
mis. dup_size = 10

library(smotefamily) smote_output = SMOTE(X = transfer_data[, -1], target = transfer_data$isFraud, K = 4, dup_size = 10)oversampled_data = smote_output$datatable(oversampled_data$isFraud)
false true
990 110
prop.table(table(oversampled_data$isFraud))
false true
0.9 0.1

Deteksi Fraud di R