Kapanış ve tekrar

R ile Denetimsiz Öğrenme

Hank Roark

Senior Data Scientist at Boeing

Vaka çalışması kapanışı

  • Denetimsiz öğrenme ile uçtan uca veri analizi süreci
  • Modellemede yaratıcı yaklaşım
  • Gerçek dünya sorunlarına hazır
R ile Denetimsiz Öğrenme

Kümeleme türleri

k-means ve dendrogram

R ile Denetimsiz Öğrenme

Boyut indirgeme

PCA projeksiyonu

R ile Denetimsiz Öğrenme

Model seçimi

# Initialize total within sum of squares error: wss
wss <- 0

# Look over 1 to 15 possible clusters
for (i in 1:15) {
  # Fit the model: km.out
  km.out <- kmeans(pokemon, centers = i, nstart = 20, iter.max = 50)
  # Save the within cluster sum of squares
  wss[i] <- km.out$tot.withinss
}

# Produce a scree plot
plot(1:15, wss, type = "b", 
     xlab = "Number of Clusters", 
     ylab = "Within groups sum of squares")
R ile Denetimsiz Öğrenme

PCA sonuçlarını yorumlama

biplot ve scree plot

R ile Denetimsiz Öğrenme

Veriyi ölçeklendirmenin önemi

ölçeklenmiş ve ölçeklenmemiş özellik öneminin karşılaştırılması

R ile Denetimsiz Öğrenme

Kurs özeti

pr.iris <- prcomp(x = iris[-5],
                  scale = FALSE,
                  center = TRUE)
summary(pr.iris)
Bileşenlerin önemi:
                          PC1     PC2    PC3     PC4
Standart sapma         2.0563 0.49262 0.2797 0.15439
Varyans Oranı          0.9246 0.05307 0.0171 0.00521
Kümülatif Oran         0.9246 0.97769 0.9948 1.00000
R ile Denetimsiz Öğrenme

Dendrogram

dendrogram

R ile Denetimsiz Öğrenme

Her algoritmanın güçlü ve zayıf yanları

farklı kümeleme sonuçları

R ile Denetimsiz Öğrenme

Kurs özeti

# Repeat for components 1 and 3
plot(wisc.pr$x[, c(1, 3)], col = (diagnosis + 1), 
     xlab = "PC1", ylab = "PC3")

temel bileşenler

R ile Denetimsiz Öğrenme

Becerilerinizi geliştirin!

R ile Denetimsiz Öğrenme

Preparing Video For Download...