PCA dönüşümünü görselleştirme

Python'da Unsupervised Learning

Benjamin Wilson

Director of Research at lateral.io

Boyut indirgeme

Daha verimli depolama ve hesaplama
Daha az bilgilendirici "gürültü" özelliklerini kaldırır
... bu özellikler sınıflandırma, regresyon gibi tahmin görevlerinde sorun yaratır

rotasyonlu eksenlerle şarap verisinin saçılım grafiği

[[ 2.8   3.92]
 ...
 [ 2.05  1.6 ]]

from sklearn.decomposition import PCA

model = PCA()
model.fit(samples)

PCA()

transformed = model.transform(samples)

print(transformed)

[[  1.32771994e+00   4.51396070e-01]
 [  8.32496068e-01   2.33099664e-01]
 ...
 [ -9.33526935e-01  -4.60559297e-01]]

Veri kümesindeki özellikler genelde ilişkilidir; örn. total_phenols ve od280
PCA veriyi eksenlere hizalar
Ortaya çıkan PCA özellikleri doğrusal olarak ilişkili değildir ("dekorelasyon")

rotasyonlu eksenlerle şarap verisinin saçılım grafiği

korelasyonu 0.7, 0 ve -0.7 olan 3 saçılım grafiği

2 kırmızı okla temel bileşen yönlerini (döndürülmüş eksenler) gösteren şarap verisi saçılım grafiği

print(model.components_)

[[ 0.64116665  0.76740167]
 [-0.76740167  0.64116665]]

Python'da Unsupervised Learning