Introductie tot k-means-clustering

Unsupervised learning in R

Hank Roark

Senior Data Scientist at Boeing

k-means-clusteringalgoritme

  • Eerste van twee clusteringalgoritmes in deze course
  • Verdeelt observaties in een vooraf bepaald aantal clusters

twee groepen

Unsupervised learning in R

k-means in R

# k-means algorithm with 5 centers, run 20 times
kmeans(x, centers = 5, nstart = 20)
  • Eén observatie per rij, één feature per kolom
  • k-means heeft een willekeurig component
  • Run het algoritme meerdere keren voor meer kans op het beste model
Unsupervised learning in R

Eerste oefeningen

  • Eerste oefening gebruikt synthetische data
  • Synthetische data uit 3 subgroepen
  • Beste aantal subgroepen voor k-means kiezen
  • Later in dit hoofdstuk een leuker voorbeeld
Unsupervised learning in R

Laten we oefenen!

Unsupervised learning in R

Preparing Video For Download...