Pengantar studi kasus

Unsupervised Learning di R

Hank Roark

Senior Data Scientist at Boeing

Tujuan

  • Selesaikan analisis dengan unsupervised learning
  • Perkuat materi yang sudah dipelajari
  • Tambahkan langkah yang belum dibahas (mis. menyiapkan data, memilih fitur yang baik untuk supervised learning)
  • Tekankan kreativitas
Unsupervised Learning di R

Contoh use case

  • Data massa payudara manusia:
    • Sepuluh fitur diukur dari tiap inti sel
    • Informasi ringkas disediakan untuk tiap kelompok sel
    • Termasuk diagnosis: jinak (non-kanker) dan ganas (kanker)
1 Sumber: K. P. Bennett dan O. L. Mangasarian: "Robust Linear Programming Discrimination of Two Linearly Inseparable Sets"
Unsupervised Learning di R

Analisis

  • Unduh dan siapkan data untuk pemodelan
  • Analisis data eksploratori (# observasi, # fitur, dll.)
  • Lakukan PCA dan interpretasikan hasilnya
  • Lakukan dua jenis klastering
  • Pahami dan bandingkan keduanya
  • Gabungkan PCA dan klastering
Unsupervised Learning di R

Tinjauan: PCA di R

pr.iris <- prcomp(x = iris[-5],
                  scale = FALSE,
                  center = TRUE)
summary(pr.iris)
Importance of components:
                          PC1     PC2    PC3     PC4
Standard deviation     2.0563 0.49262 0.2797 0.15439
Proportion of Variance 0.9246 0.05307 0.0171 0.00521
Cumulative Proportion  0.9246 0.97769 0.9948 1.00000
Unsupervised Learning di R

Pembelajaran tanpa supervisi bersifat terbuka

  • Langkah pada use case ini hanya salah satu contoh
  • Ada pendekatan lain untuk menganalisis dataset ini
Unsupervised Learning di R

Ayo berlatih!

Unsupervised Learning di R

Preparing Video For Download...