Problemi etici nel ciclo di vita dei dati

Introduzione all'etica dei dati

Shalini Kurapati, PhD

Co-founder and CEO, Clearbox AI

Il ciclo di vita dei dati

  • In ogni fase del ciclo di vita dei dati
  • Acquisizione dei dati: raccolta, approvvigionamento
  • Preparazione dei dati: pulizia, etichettatura, controlli di qualità
  • Archiviazione dei dati: infrastruttura, sicurezza, integrità
  • Analisi dei dati: IA, interpretazione, processo decisionale
  • Conservazione/archiviazione
  • Condivisione

Immagine del ciclo di vita dei dati

1 https://www.ibm.com/topics/data-life cycle-management#Data%20life cycle%20management%20and%20IBM 2 Icona realizzata da Flat Icons da www.flaticon.com
Introduzione all'etica dei dati

Acquisizione dei dati

Immagine dell'acquisizione di dati da diverse fonti che confluiscono in un computer

  • Diversi modi: sondaggi, applicazioni mobili, sensori, dispositivi indossabili, web scraping, terze parti
  • Ti è consentito raccogliere i dati? Privacy, copyright
  • Raccolta mirata: chiara sul motivo (perché) e sulla quantità (quanti dati)
  • Dati rappresentativi, rispettosi del tempo delle persone
  • Il consenso informato: fondamentale
  • Controllare i fornitori di dati
1 Icona realizzata da Parzival 1997 da www.flaticon.com
Introduzione all'etica dei dati

Preparazione dei dati

Screenshot di un articolo della rivista TIME su come i lavoratori kenioti sono stati sfruttati per la pulizia e l'etichettatura dei dati per migliorare ChatGPT.

  • Pulizia, etichettatura, annotazione: trascrizione di file audio, etichettatura di testo o immagini, segnalazione di contenuti inappropriati
  • Annotatori umani: formazione inadeguata, sfruttamento, lavoratori kenioti per ChatGPT
  • Incoerenze nella qualità dei dati, etichette distorte
1 https://time.com/6247678/openai-chatgpt-kenya-workers/
Introduzione all'etica dei dati

Archiviazione dei dati

Immagine di un sistema di archiviazione dati sicuro.

  • Riservatezza e integrità: prevenire le violazioni dei dati o le perdite accidentali
  • Sicurezza dei dati: nessun accesso non autorizzato
  • Aspetto tecnico:
    • Infrastrutture, metodi, tecniche e dispositivi per l'archiviazione dei dati
  • Aspetto organizzativo:
    • Politiche aziendali, formazione
1 Icona realizzata da HJ studio da www.flaticon.com
Introduzione all'etica dei dati

Condivisione dei dati

Mappa che indica gli epicentri e la diffusione dell'epidemia del Covid-19

  • La condivisione dei dati è necessaria per l'innovazione e la collaborazione, a volte anche per la monetizzazione
  • Esito positivo se responsabile: condivisione dei dati sul Covid
  • Norme sulla privacy, diritti individuali
  • Proprietà dei dati, consenso informato
  • Condivisione a tutela della privacy
1 https://www.ga4gh.org/news/regulatory-ethics-perspective-on-covid-19-data-sharing-an-interview-with-johan-ordish/
Introduzione all'etica dei dati

Passiamo alla pratica!

Introduzione all'etica dei dati

Preparing Video For Download...