k-en yakın komşu uzaklık skoru

R ile Anomali Tespitine Giriş

Alastair Rushworth

Data Scientist

Mobilya boyutları

plot(Width ~ Height, data = furniture)

R ile Anomali Tespitine Giriş

k-en yakın komşu (kNN) uzaklığı

Anomaliler genelde komşularından uzakta olur

R ile Anomali Tespitine Giriş

Uzaklık matrisi hesaplaması için girdiler

library(FNN)
furniture_knn <- get.knn(data = furniture, k = 5)

 

Argümanlar

  • data: veri matrisi
  • k: komşu sayısı
R ile Anomali Tespitine Giriş

Uzaklık matrisi çıktısı

get.knn() iki matris döndürür

names(furniture_knn)
"nn.index" "nn.dist" 

Uzaklık matrisi

head(furniture_knn$nn.dist, 3)
         [,1]     [,2]     [,3]     [,4]     [,5]
[1,] 5.128300 5.367791 5.390801 5.740713 8.477025
[2,] 4.300093 5.367791 6.159139 7.091966 7.428176
[3,] 3.047502 3.545978 4.426266 5.006570 5.654202
R ile Anomali Tespitine Giriş

kNN uzaklık skoru

En yakın komşulara ortalama uzaklık

furniture_score <- rowMeans(furniture_knn$nn.dist)

 

En büyük skor?

which.max(furniture_score)
29
R ile Anomali Tespitine Giriş

Haydi pratik yapalım!

R ile Anomali Tespitine Giriş

Preparing Video For Download...