Bias di selezione

Conquering Data Bias

Konstantinos Kattidis

Data Analytics Lead

Cos’è il bias di selezione?

È il bias introdotto quando i dati per l’analisi sono selezionati in modo da favorire sistematicamente certe persone, gruppi o caratteristiche

Diagramma che mostra una popolazione diversa dal campione.

Quindi il campione ottenuto non rappresenta la popolazione da analizzare

Esaminiamo i cinque tipi comuni di bias di selezione

Conquering Data Bias

1. Bias di campionamento

  • Il bias di campionamento si verifica quando il metodo di campionamento non è equo o casuale
  • Nasce dall’approccio scelto per ottenere il campione, che può rendere difficile o impossibile estendere i risultati all’intera popolazione
  • Per esempio:
    • Una piattaforma e-commerce analizza la soddisfazione clienti con un campionamento di convenienza
    • I risultati potrebbero non riflettere il sentiment dell’intera base clienti

Persona che decide quale metodo di campionamento usare

Conquering Data Bias

2. Bias di sotto-copertura

  • Considera una ricerca di mercato rivolta ai consumatori online, escludendo chi non ha accesso a internet
  • Il bias di sotto-copertura evidenzia la rappresentanza inadeguata di alcuni gruppi nel campione scelto
  • Si distingue dal bias di campionamento perché si concentra sulla rappresentanza di gruppi specifici, non sulla casualità o correttezza del metodo di campionamento

Ricercatori che ignorano i consumatori senza accesso a internet

Conquering Data Bias

3. Bias di non risposta

Il bias di non risposta nasce quando chi non partecipa a un sondaggio o studio differisce sistematicamente da chi partecipa

Sondaggio di soddisfazione: rispondenti soddisfatti e non rispondenti insoddisfatti

  • In un sondaggio sulla soddisfazione dei dipendenti, gli insoddisfatti partecipano meno
  • Questo porta a una visione troppo ottimistica del morale
Conquering Data Bias

4. Bias di auto-selezione

Analista che esplora risultati influenzati dall’auto-selezione

  • Il bias di auto-selezione si verifica quando le persone scelgono di partecipare a uno studio o di dare feedback
  • Per esempio:
    • I clienti si auto-selezionano per un sondaggio di soddisfazione
    • Le loro opinioni non rappresentano l’intera base clienti
    • Questo altera la percezione complessiva
Conquering Data Bias

5. Bias di sopravvivenza

Si verifica quando nell’analisi sono incluse solo entità di successo

Per esempio:

  • Analizzare i lanci di prodotto riusciti senza considerare quelli falliti
  • Porta a insight distorti, ignorando fattori critici di insuccesso

Persona che analizza prodotti riusciti ignorando quelli falliti

Conquering Data Bias

Creare una visione coerente

Bilancia sbilanciata con punto interrogativo

  • Non è raro che più bias interagiscano, complicando l’analisi
  • Per esempio, un sondaggio di soddisfazione clienti può mostrare sia bias di auto-selezione sia bias di non risposta
Conquering Data Bias

¡Vamos a practicar!

Conquering Data Bias

Preparing Video For Download...