Anomalie etichettate

Introduzione all'Anomaly Detection in R

Alastair Rushworth

Data Scientist

Dati di immagini satellitari

head(sat, 5)
  label V1  V2  V3 V4 V5
1     0 92 115 120 94 84
2     0 84 102 106 79 84
3     0 84 102 102 83 80
4     0 80 102 102 79 84
5     0 84  94 102 79 80
Introduzione all'Anomaly Detection in R

Dati di immagini satellitari

table(sat$label)
   0    1 
5732   71

Quota immagini cotone:

71 / 5803
0.01223505
Introduzione all'Anomaly Detection in R

Visualizza le vere anomalie

plot(V2 ~ V3, data = sat, col = as.factor(label), pch = 20)

Introduzione all'Anomaly Detection in R

Punteggio di anomalia vs. etichetta reale

sat_for <- iForest(sat[, -1], nt = 100)
sat$score <- predict(sat_for, features)

boxplot(score ~ label, data = sat, col = "olivedrab4")

Introduzione all'Anomaly Detection in R

Perché non usare modelli per predire le etichette?

Esempio 1: Rilevare malattie rare

  • Troppi pochi casi

 

Esempio 2: Frodi con carta di credito

  • Cambia rapidamente
Introduzione all'Anomaly Detection in R

Passiamo alla pratica!

Introduzione all'Anomaly Detection in R

Preparing Video For Download...