PCA'ya Giriş

R ile Denetimsiz Öğrenme

Hank Roark

Senior Data Scientist at Boeing

İki kümeleme yöntemi

  • İki kümeleme yöntemi: benzer öğe gruplarını bulma
  • Sırada, boyut indirgeme
    • Özelliklerde yapı bulma
    • Görselleştirmeye yardımcı olur
R ile Denetimsiz Öğrenme

Boyut indirgeme

  • Yaygın bir yöntem: temel bileşen analizi (PCA)
  • Daha düşük boyutlu gösterim bulurken üç amaç:
    • Temel bileşenler için değişkenlerin doğrusal birleşimlerini bulmak
    • Verideki varyansın çoğunu korumak
    • Temel bileşenler ilişkisizdir (yani, birbirine ortogonaldir)
R ile Denetimsiz Öğrenme

PCA sezgisi

saçılım grafiği

R ile Denetimsiz Öğrenme

PCA sezgisi

regresyon doğrusu

R ile Denetimsiz Öğrenme

PCA sezgisi

bileşen puanlarının izdüşümü

R ile Denetimsiz Öğrenme

Yüksek boyutlu verilerin görselleştirilmesi

veriler için farklı boyut sayıları

R ile Denetimsiz Öğrenme

Görselleştirme

iris veri setinde PCA

R ile Denetimsiz Öğrenme

R'de PCA

pr.iris <- prcomp(x = iris[-5],
                  scale = FALSE,
                  center = TRUE)

summary(pr.iris)
Importance of components:
                          PC1     PC2    PC3     PC4
Standard deviation     2.0563 0.49262 0.2797 0.15439
Proportion of Variance 0.9246 0.05307 0.0171 0.00521
Cumulative Proportion  0.9246 0.97769 0.9948 1.00000
R ile Denetimsiz Öğrenme

Haydi pratik yapalım!

R ile Denetimsiz Öğrenme

Preparing Video For Download...