Questions éthiques tout au long du cycle de vie des données

Introduction à l'éthique des données

Shalini Kurapati, PhD

Co-founder and CEO, Clearbox AI

Cycle de vie des données

  • À chaque étape du cycle des données
  • Acquisition : collecte, sourçage
  • Préparation : nettoyage, étiquetage, contrôles de qualité
  • Stockage : infrastructure, sécurité, intégrité
  • Analyse : IA, interprétation, décision
  • Conservation/archivage
  • Partage

Illustration du cycle de vie des données.

1 https://www.ibm.com/topics/data-life cycle-management#Data%20life cycle%20management%20and%20IBM 2 Icône réalisée par Flat Icons, www.flaticon.com
Introduction à l'éthique des données

Acquisition de données

Illustration de l’acquisition de données provenant de différentes sources et entrant dans un ordinateur

  • Plusieurs moyens : enquêtes, applications mobiles, capteurs, technologie portable, web scraping, tierce parties
  • Êtes-vous autorisé à collecter les données ? Confidentialité, droits d’auteur
  • Collecte ciblée : pourquoi et combien
  • Des données représentatives, respectueuses du temps de chacun
  • Consentement éclairé : crucial
  • Vérifiez vos fournisseurs de données
1 Icône réalisée par Parzival 1997, www.flaticon.com
Introduction à l'éthique des données

Préparation des données

Capture d’écran d’un article du magazine TIME sur l’exploitation de travailleurs kenyans pour le nettoyage et l’étiquetage de données pour améliorer ChatGPT.

  • Nettoyage, étiquetage, annotation : transcription de fichiers audio, étiquetage de texte ou d’images, signalement de contenu inapproprié
  • Annotateurs humains : formation inadéquate, exploitation, travailleurs kenyans pour ChatGPT
  • Incohérences dans la qualité des données, étiquettes biaisées
1 https://time.com/6247678/openai-chatgpt-kenya-workers/
Introduction à l'éthique des données

Stockage des données

Illustration d’un système de stockage de données sécurisé.

  • Confidentialité et intégrité : prévenir les violations de données ou les pertes accidentelles
  • Sécurité des données : pas d’accès non autorisé
  • Niveau technique :
    • Infrastructure, méthodes, techniques et appareils pour le stockage de données
  • Niveau organisationnel :
    • Stratégies d’entreprise, formation
1 Icône réalisée par HJ studio, www.flaticon.com
Introduction à l'éthique des données

Partage des données

Carte indiquant les épicentres et la propagation de l’épidémie de Covid-19

  • Le partage des données favorise innovation, collaboration et parfois monétisation
  • Résultat positif si responsable : partage des données Covid
  • Réglementation en matière de protection de la vie privée, droits individuels
  • Propriété des données, consentement éclairé
  • Partage préservant la confidentialité
1 https://www.ga4gh.org/news/regulatory-ethics-perspective-on-covid-19-data-sharing-an-interview-with-johan-ordish/
Introduction à l'éthique des données

Passons à la pratique !

Introduction à l'éthique des données

Preparing Video For Download...