Selectiebias

Data-bias overwinnen

Konstantinos Kattidis

Data Analytics Lead

Wat is selectiebias?

Dit is de bias die ontstaat wanneer data voor analyse zo wordt geselecteerd dat bepaalde personen, groepen of kenmerken systematisch worden bevoordeeld

Diagram met een populatie die verschilt van de steekproef.

Daardoor is de steekproef niet representatief voor de bedoelde populatie

Laten we de vijf veelvoorkomende types selectiebias bekijken

Data-bias overwinnen

1. Steekproefbias

  • Steekproefbias ontstaat wanneer de steekproefmethode niet eerlijk of niet willekeurig is
  • Het komt door de gekozen aanpak om de steekproef te verkrijgen, wat generaliseren naar de hele populatie lastig of onmogelijk kan maken
  • Bijvoorbeeld:
    • Een e-commerceplatform meet klanttevredenheid met gemaksteekproeven
    • De uitkomst weerspiegelt mogelijk niet alle klanten

Persoon twijfelt welke steekproefmethode te gebruiken

Data-bias overwinnen

2. Undercoverage-bias

  • Denk aan marktonderzoek naar online consumenten dat mensen zonder internet uitsluit
  • Undercoverage-bias wijst op onvoldoende vertegenwoordiging van bepaalde groepen in de steekproef
  • Het verschilt van steekproefbias: focus ligt op representatie van specifieke groepen, niet op willekeur of eerlijkheid van de methode

Onderzoekers negeren consumenten zonder internettoegang

Data-bias overwinnen

3. Non-responsbias

Non-responsbias ontstaat wanneer niet-deelnemers systematisch verschillen van deelnemers

Tevredenheidsenquête waar respondenten tevreden zijn en niet-respondenten ontevreden

  • In een onderzoek naar medewerkerstevredenheid doen ontevreden medewerkers minder vaak mee
  • Dit leidt tot een te rooskleurig beeld van het moreel
Data-bias overwinnen

4. Zelfselectiebias

Analist onderzoekt resultaten beïnvloed door zelfselectie

  • Zelfselectiebias ontstaat wanneer mensen er zelf voor kiezen om mee te doen of feedback te geven
  • Bijvoorbeeld:
    • Klanten kiezen zelf om mee te doen aan een tevredenheidsenquête
    • Hun mening vertegenwoordigt niet de volledige klantenbasis
    • Dit vertekent het totaalbeeld
Data-bias overwinnen

5. Survivorship bias

Dit gebeurt wanneer alleen succesvolle entiteiten in de analyse worden opgenomen

Bijvoorbeeld:

  • Succesvolle productlanceringen analyseren zonder de mislukte mee te nemen
  • Dat levert bevooroordeelde inzichten op en mist factoren die tot falen leiden

Persoon analyseert succesproducten en negeert de mislukte

Data-bias overwinnen

Een samenhangend beeld vormen

Ongebalanceerde weegschaal met vraagteken

  • Het is niet ongewoon dat meerdere biases samenkomen en analyses bemoeilijken
  • Zo kan een klanttevredenheidsenquête zowel zelfselectie- als non-responsbias hebben
Data-bias overwinnen

Laten we oefenen!

Data-bias overwinnen

Preparing Video For Download...