Etiketli aykırılıklar

R ile Anomali Tespitine Giriş

Alastair Rushworth

Data Scientist

Uydu görüntü verisi

head(sat, 5)
  label V1  V2  V3 V4 V5
1     0 92 115 120 94 84
2     0 84 102 106 79 84
3     0 84 102 102 83 80
4     0 80 102 102 79 84
5     0 84  94 102 79 80
R ile Anomali Tespitine Giriş

Uydu görüntü verisi

table(sat$label)
   0    1 
5732   71

Pamuk mahsulü oranı:

71 / 5803
0.01223505
R ile Anomali Tespitine Giriş

Gerçek aykırılıkları görselleştirme

plot(V2 ~ V3, data = sat, col = as.factor(label), pch = 20)

R ile Anomali Tespitine Giriş

Aykırılık skoru ve gerçek etiket

sat_for <- iForest(sat[, -1], nt = 100)
sat$score <- predict(sat_for, features)

boxplot(score ~ label, data = sat, col = "olivedrab4")

R ile Anomali Tespitine Giriş

Neden etiketleri tahmin eden modelleri kullanmayalım?

Örnek 1: Nadir hastalık vakalarını tespit

  • Vaka sayısı çok az

 

Örnek 2: Kredi kartı dolandırıcılığı

  • Hızla değişir
R ile Anomali Tespitine Giriş

Hadi pratik yapalım!

R ile Anomali Tespitine Giriş

Preparing Video For Download...