Questions éthiques tout au long du cycle de vie des données

Introduction à l'éthique des données

Shalini Kurapati, PhD

Co-founder and CEO, Clearbox AI

Cycle de vie des données

  • À chaque étape du cycle des données
  • Acquisition : collecte, sourçage
  • Préparation : nettoyage, étiquetage, contrôles de qualité
  • Stockage : infrastructure, sécurité, intégrité
  • Analyse : IA, interprétation, décision
  • Conservation/archivage
  • Partage

Illustration du cycle de vie des données.

1 https://www.ibm.com/topics/data-life cycle-management#Data%20life cycle%20management%20and%20IBM 2 Icône réalisée par Flat Icons, www.flaticon.com
Introduction à l'éthique des données

Acquisition de données

Illustration de l’acquisition de données provenant de différentes sources et entrant dans un ordinateur

  • Moyens variés : enquêtes, apps, capteurs, portables, web scraping, tiers.
  • Êtes-vous autorisé à collecter les données ? Confidentialité, droits d’auteur
  • Collecte ciblée : pourquoi et combien
  • Des données représentatives, respectueuses du temps de chacun
  • Consentement éclairé : crucial
  • Vérifiez vos fournisseurs de données
1 Icône réalisée par Parzival 1997, www.flaticon.com
Introduction à l'éthique des données

Préparation des données

![https://assets.datacamp.com/production/repositories/6243/datasets/64d0122bb15c8f67493bbaddf3183ae34da22def/Time_ChatGPT_Kenya.JPG Capture d'écran d'un article du magazine The TIME sur l'exploitation des travailleurs kenyans lors du nettoyage et de l'étiquetage des données visant à améliorer chatGPT.

  • Nettoyage, étiquetage, annotation : transcription de fichiers audio, étiquetage de texte ou d’images, signalement de contenu inapproprié
  • Annotateurs humains : formation insuffisante, exploitation, travailleurs kenyans pour chatGPT
  • Incohérences dans la qualité des données, étiquettes biaisées
1 https://time.com/6247678/openai-chatgpt-kenya-workers/
Introduction à l'éthique des données

Stockage des données

Illustration d’un système de stockage de données sécurisé.

  • Confidentialité et intégrité : prévenir les violations de données ou les pertes accidentelles
  • Sécurité des données : pas d’accès non autorisé
  • Niveau technique :
    • Infrastructure, méthodes, techniques et appareils pour le stockage de données
  • Niveau organisationnel :
    • Stratégies d’entreprise, formation
1 Icône créée par HJ studio à partir de www.flaticon.com
Introduction à l'éthique des données

Partage des données

Carte indiquant les épicentres et la propagation de l’épidémie de Covid-19

  • Le partage des données favorise innovation, collaboration et parfois monétisation
  • Résultat positif si responsable : partage des données Covid
  • Réglementation en matière de protection de la vie privée, droits individuels
  • Propriété des données, consentement éclairé
  • Partage préservant la confidentialité
1 https://www.ga4gh.org/news/regulatory-ethics-perspective-on-covid-19-data-sharing-an-interview-with-johan-ordish/
Introduction à l'éthique des données

Passons à la pratique !

Introduction à l'éthique des données

Preparing Video For Download...