Tinjauan PCA dan langkah berikutnya

Unsupervised Learning di R

Hank Roark

Senior Data Scientist at Boeing

Tinjauan sejauh ini

  • Mengunduh data dan menyiapkannya untuk pemodelan
  • Analisis data eksploratif
  • Melakukan principal component analysis (PCA)
Unsupervised Learning di R

Langkah berikutnya

  • Selesaikan hierarchical clustering
  • Selesaikan k-means clustering
  • Gabungkan PCA dan clustering
  • Bandingkan hasil hierarchical clustering dengan diagnosis
  • Bandingkan hasil hierarchical dan k-means
  • PCA sebagai langkah prapemrosesan untuk clustering
Unsupervised Learning di R

Tinjauan: hierarchical clustering di R

# Calculates similarity as Euclidean distance between observations
s <- dist(x)

# Returns hierarchical clustering model
hclust(s)
Call:
hclust(d = s)

Cluster method   : complete 
Distance         : euclidean 
Number of objects: 50 
Unsupervised Learning di R

Tinjauan: k-means di R

$$

# k-means algorithm with 5 centers, run 20 times
kmeans(x, centers = 5, nstart = 20)

$$

  • Satu observasi per baris, satu fitur per kolom
  • k-means memiliki komponen acak
  • Jalankan beberapa kali untuk meningkatkan peluang model terbaik
Unsupervised Learning di R

Ayo berlatih!

Unsupervised Learning di R

Preparing Video For Download...