Inzichten uit de data

Data Literacy-casestudy: Analyse van werken op afstand

Maarten Van den Broeck

Senior Content Developer at DataCamp

Clusteranalyse

  • Veelgebruikte beschrijvende en verkennende techniek
  • Doel: natuurlijke groepen in de data vinden

  • Mogelijke toepassingen:

    • Klantsegmentatie
    • Een classificatie maken
    • Subgroepen identificeren
  • Twee hoofd­stappen:

    • Het optimale aantal groepen bepalen
    • De kenmerken van elke groep onderzoeken

Voorbeeld clusteranalyse

Data Literacy-casestudy: Analyse van werken op afstand

Het optimale aantal groepen vinden

  • Bepalen van de optimale oplossing
  • Domeinkennis: experts/bedrijf
  • Niet altijd een exacte oplossing!

2 vs. 3 clusters

Data Literacy-casestudy: Analyse van werken op afstand

Kenmerken van de groepen

  • Hoe verschillen ze?
  • Gedeelde kenmerken tussen een subset van groepen
  • Relevante variabelen

Staafdiagram van aantallen per cluster voor tevredenheids­score

Data Literacy-casestudy: Analyse van werken op afstand

Laten we oefenen!

Data Literacy-casestudy: Analyse van werken op afstand

Preparing Video For Download...