Tipi di bias nei dati

Conquering Data Bias

Konstantinos Kattidis

Data Analytics Lead

La dinamica del decision making

Persona che decide tra cena e carriera

Gli adulti prendono circa 35.000 decisioni consapevoli al giorno

«Che carriera dovrei seguire?»

«Cosa mangio per cena?»

  • Le euristiche aiutano il cervello a semplificare e decidere più in fretta

  • MA le euristiche possono causare... bias cognitivi

1 https://hbr.org/2023/12/a-simple-way-to-make-better-decisions
Conquering Data Bias

Bias cognitivi

Schemi sistematici di deviazione dalla norma o dalla razionalità nei giudizi e nelle decisioni

  • I bias nei dati possono derivare da questi bias cognitivi

  • Esempio: un/una analyst che favorisce inconsciamente i dati positivi analizzando una campagna di marketing recente

Analista che si concentra sui dati positivi

Conquering Data Bias

Bias sistemici

  • I bias cognitivi riguardano le decisioni individuali; i bias sistemici evidenziano problemi più ampi che guidano le attività sui dati
  • Bias insiti in processi, strutture o sistemi usati per raccogliere, analizzare e interpretare i dati
  • Originano per vari motivi: metodi di raccolta parziali e design algoritmico

Donna che riflette sui bias sistemici

Conquering Data Bias

Bias nel ciclo di vita dei dati

Diagramma con ciclo di vita dei dati e bias

  • I bias sistemici e cognitivi sono all’origine dei bias nei dati
  • Capire i vari tipi di bias è il primo passo per difendersi dal loro impatto
Conquering Data Bias

Svelare i bias nella raccolta dati

  • Bias di selezione
    • Il processo di raccolta favorisce certi gruppi o caratteristiche rispetto ad altri
  • Bias storico
    • Dati storici che riflettono disuguaglianze o problemi sistemici passati
  • Bias di misurazione
    • Strumenti o metodi rappresentano in modo sistematico alcuni attributi in modo errato

Diagramma con bias nel ciclo di vita, raccolta dati

Conquering Data Bias

Svelare i bias nell’analisi dei dati

  • Bias cognitivi
    • Il bias di conferma è uno dei più noti
    • È la tendenza a cercare e interpretare info che confermano credenze preesistenti
  • Bias di reporting
    • Si verifica quando certi risultati vengono enfatizzati o nascosti, plasmando la narrazione sui dati

Diagramma con bias nel ciclo di vita, analisi dei dati

Conquering Data Bias

Bias nello sviluppo dei modelli

  • Bias algoritmico

    • Avviene quando i modelli ML riflettono i bias presenti nei dati di training
  • Bias da automazione

    • Richiede supervisione umana: i processi automatici possono perpetuare o amplificare bias esistenti

Diagramma con bias nel ciclo di vita, algoritmi

Conquering Data Bias

Ayo berlatih!

Conquering Data Bias

Preparing Video For Download...