Veelgemaakte dat fouten

Introductie tot data

Maarten Van den Broeck

Senior Content Developer at DataCamp

Veelgemaakte fouten met data

Een fout bij het werken met data

Introductie tot data

Veelgemaakte fouten met data

  • Geen duidelijke doelstelling of vraag

Pictogrammen die een fout bij dataverwerking tonen door een slecht gedefinieerd probleem

Introductie tot data

Veelgemaakte fouten met data

  • Geen duidelijke doelstelling of vraag
  • Onvoldoende of verkeerde data

Pictogrammen die een fout bij dataverwerking tonen door een slecht gedefinieerd probleem en verkeerde data

Introductie tot data

Veelgemaakte fouten met data

  • Geen duidelijke doelstelling of vraag
  • Onvoldoende of verkeerde data
  • Geen passende analyse

Pictogrammen die een fout bij dataverwerking tonen door een slecht gedefinieerd probleem, en verkeerde data en statistieken

Introductie tot data

Veelgemaakte fouten met data

  • Geen duidelijke doelstelling of vraag
  • Onvoldoende of verkeerde data
  • Geen passende analyse
  • Geen duidelijke communicatie van resultaten

$$

Plan het dataproces zorgvuldig vooraf

Pictogrammen die een fout bij dataverwerking tonen door een slecht gedefinieerd probleem, en verkeerde data, statistiek en communicatie

Introductie tot data

Probleem niet duidelijk definiëren

"Heb je afgelopen maand iets gekocht?"

$$

"Waar deed je je laatste aankoop?"

"Welke betaalmethode gebruikte je?"

Kan leiden tot ongepaste dataverzameling, analyse en conclusies

een datavraag definiëren

Introductie tot data

Onvoldoende of verkeerde data

verkeerde data

$$

$$

Databias: de steekproef vertegenwoordigt niet alle data

  • Verkeerde data verzamelen beantwoordt de onderzoeksvraag niet
  • Data moet nog worden opgeschoond voor analyse
Introductie tot data

Geen passende analyse

$$

  • Te snel conclusies trekken
  • Gebrek aan context: ontbrekende reden bij de resultaten
  • Andere voorbeelden:
    • Onjuiste aggregaties en berekeningen
    • Correlatie verwarren met causaliteit

slechte data-analyse

Introductie tot data

Geen duidelijke communicatie van resultaten

datacommunicatie

$$

  • Meest waardevolle deel van de datacyclus
  • Kan leiden tot misverstanden of foute conclusies
  • Voorbeelden:
    • Te technisch
    • Cherry-picken van datapunten
    • Onduidelijke visualisaties
Introductie tot data

Laten we oefenen!

Introductie tot data

Preparing Video For Download...