Kategorik özelliklerle çalışmak

R ile Anomali Tespitine Giriş

Alastair Rushworth

Data Scientist

Sütun sınıflarını kontrol etme

Tek bir sütunun sınıfı

class(sat$V1)
"numeric"

Tüm sütunların sınıfı

sapply(X = sat, FUN = class)
      label          V1          V2          V3         V4          V5          V6    high_low
  "numeric"   "numeric"   "numeric"   "numeric"  "numeric"   "numeric"   "numeric" "character"
R ile Anomali Tespitine Giriş

Isolation forest

Kategorik özellikleri factor olarak kodlayın

sat$high_low <- as.factor(sat$high_low)

class(sat$high_low)
"factor"

Isolation forest’ı eğitin

sat_for <- iForest(sat[, -1], nt = 100)
R ile Anomali Tespitine Giriş

Faktörlerle LOF

Gower mesafesi, kategorik ve sayısal özelliklere sahip noktalar arasındaki uzaklığı ölçer

 

library(cluster)
sat_dist <- daisy(sat[, -1], metric = "gower")

sat_dist ögesini lof’a verin

sat_lof <- lof(sat_dist, k = 10)

R ile Anomali Tespitine Giriş

Gower uzaklık matrisini inceleme

  • Nesneyi matrise dönüştürün
sat_distmat <- as.matrix(sat_dist)

 

  • Noktalar arası en büyük ve en küçük mesafeleri bulun
range(sat_distmat)
0.0000000 0.8680774
R ile Anomali Tespitine Giriş

Haydi pratik yapalım!

R ile Anomali Tespitine Giriş

Preparing Video For Download...