PCA gözden geçirme ve sonraki adımlar

R ile Denetimsiz Öğrenme

Hank Roark

Senior Data Scientist at Boeing

Şu ana kadarki özet

  • Veriler indirildi ve modelleme için hazırlandı
  • Keşifsel veri analizi
  • Temel bileşen analizi (PCA) uygulandı
R ile Denetimsiz Öğrenme

Sonraki adımlar

  • Hiyerarşik kümelemeyi tamamlayın
  • k-means kümelemeyi tamamlayın
  • PCA ve kümelemeyi birleştirin
  • Hiyerarşik kümeleme sonuçlarını tanı ile karşılaştırın
  • Hiyerarşik ve k-means sonuçlarını kıyaslayın
  • Kümeleme için PCA’yı ön işleme adımı olarak kullanın
R ile Denetimsiz Öğrenme

Gözden geçirme: R’da hiyerarşik kümeleme

# Gözlemler arası benzerliği Öklid uzaklığıyla hesaplar
s <- dist(x)

# Hiyerarşik kümeleme modelini döndürür
hclust(s)
Call:
hclust(d = s)

Cluster method   : complete 
Distance         : euclidean 
Number of objects: 50 
R ile Denetimsiz Öğrenme

Gözden geçirme: R’da k-means

$$

# 5 merkezli k-means algoritması, 20 kez çalıştırılır
kmeans(x, centers = 5, nstart = 20)

$$

  • Satır başına bir gözlem, sütun başına bir özellik
  • k-means rastgelelik içerir
  • En iyi modele ulaşma olasılığını artırmak için algoritmayı çok kez çalıştırın
R ile Denetimsiz Öğrenme

Haydi pratik yapalım!

R ile Denetimsiz Öğrenme

Preparing Video For Download...