Clustering

Data Science begrijpen

Lis Sulmont

Curriculum Manager, DataCamp

Wat is clustering?

clustering.jpg

  • Verdeel de gegevens in categorieën
  • Gebruikssituaties
    • Klantsegmentatie
    • Beeldsegmentatie
    • Detectie van afwijkingen
Data Science begrijpen

Supervised Machine Learning

 

supervised-learning.jpg

Unsupervised Machine Learning

 

unsupervised-learning.jpg

Data Science begrijpen

Casestudy: nieuwe soorten ontdekken

$$ Twee bloemen

Data Science begrijpen

Belangrijkste kenmerken

  • Bloemkleuren
  • Lengte en breedte van de bloemblaadjes
  • Lengte en breedte van de kelkblaadjes
  • Aantal bloemblaadjes

Kenmerken gemarkeerd op bloemen

Data Science begrijpen

Het aantal clusters bepalen

Bloemenobservatiegegevens

Data Science begrijpen

Het aantal clusters vergelijken

Twee clusters:

Twee clusters

Drie clusters:

Drie clusters

Data Science begrijpen

Het aantal clusters vergelijken

Vier clusters:

Vier clusters

Acht clusters:

Acht clusters

Data Science begrijpen

Het aantal clusters vergelijken

  • Het is aan jou om te beslissen hoeveel clusters je uiteindelijk wilt.
  • Gebruik je kennis van het vakgebied om te beslissen.
Data Science begrijpen

Clustering-evaluatie

Definitie

  • Een dataset zonder labels in verschillende categorieën verdelen.

Stappen

  • Kies kenmerken
  • Kies het aantal clusters
  • Gebruik clusters om problemen op te lossen
Data Science begrijpen

Laten we oefenen!

Data Science begrijpen

Preparing Video For Download...