Clustering

Data Science voor het bedrijfsleven

Ramnath Vaidyanathan

VP of Product Research, DataCamp

Wat is clustering?

Clustering

  • Deel data in categorieën
  • Use cases
    • Klantsegmentatie
    • Afbeeldingsegmentatie
    • Anomaliedetectie
Data Science voor het bedrijfsleven

Supervised Machine Learning

 

Supervised learning

Unsupervised Machine Learning

 

Unsupervised learning

Data Science voor het bedrijfsleven

Casus: klantsegmentatie

Klantsegmentatie 1

Data Science voor het bedrijfsleven

Casus: klantsegmentatie

Features bepalen

  • Aantal vluchten in het afgelopen jaar
  • Percentage internationaal
  • Vooruit plannen
  • Percentage business class

Vliegtuig

Data Science voor het bedrijfsleven

Casus: klantsegmentatie

  • Bepaal aantal clusters

Clustergegevens

Data Science voor het bedrijfsleven

Casus: klantsegmentatie

Twee clusters

Drie clusters

Data Science voor het bedrijfsleven

Clustering: samenvatting

Definitie

  • Deel een ongetagde dataset in categorieën

Stappen

  • Kies features
  • Kies aantal clusters
  • Gebruik clusters voor businessvragen
Data Science voor het bedrijfsleven

Laten we oefenen!

Data Science voor het bedrijfsleven

Preparing Video For Download...