Introduzione all'Anomaly Detection in R
Alastair Rushworth
Data Scientist
Classe di una singola colonna
class(sat$V1)
"numeric"
Classe di tutte le colonne
sapply(X = sat, FUN = class)
label V1 V2 V3 V4 V5 V6 high_low
"numeric" "numeric" "numeric" "numeric" "numeric" "numeric" "numeric" "character"
Codifica le variabili categoriche come factor
sat$high_low <- as.factor(sat$high_low)class(sat$high_low)
"factor"
Allena l'isolation forest
sat_for <- iForest(sat[, -1], nt = 100)
La distanza di Gower misura la distanza tra punti con variabili categoriche e numeriche
library(cluster)
sat_dist <- daisy(sat[, -1], metric = "gower")
Passa sat_dist a lof
sat_lof <- lof(sat_dist, k = 10)
sat_distmat <- as.matrix(sat_dist)
range(sat_distmat)
0.0000000 0.8680774
Introduzione all'Anomaly Detection in R