Que faire des données biaisées ?

Introduction à l'éthique des données

Shalini Kurapati, PhD

Co-founder and CEO, Clearbox AI

Qu’est-ce qu’un biais ?

Illustration d’un jugement partial.

  • Première réflexion sur l’éthique des données
  • Préjugés, pour ou contre une personne, un groupe ou une idée : injuste
  • Éthique des données : biais des données
  • Sous-représentation, surreprésentation ou représentation erronée
  • Effets néfastes si des données biaisées sont utilisées pour la prise de décision
1 Icône réalisée par noomtah, www.flaticon.com
Introduction à l'éthique des données

N’importe quand, n’importe où

  • À tous les stades des données et des cycles de vie
  • Collecte de données
  • Nettoyage, préparation et développement des données
  • Étiquetage des données

Illustration des biais de données à différents stades du cycle de vie des données qui alimentent des algorithmes biaisés

Introduction à l'éthique des données

Biais spécifiques aux données

  • Biais de processus technique ou statistique

    • Biais d’échantillonnage : représentation
    • Biais de mesure
    • Biais d’autodéclaration
    • Biais d’étiquetage
  • Biais humain et systématique

    • Sexe
    • Ethnicité/minorités
    • Culture

Illustration d’un objet asymétrique par rapport à son image réelle.

1 Icône réalisée par Flowicon, www.flaticon.com
Introduction à l'éthique des données

La représentation est essentielle

Capture d’écran du discours Ted de Joy avec une photo d’elle portant un masque blanc

  • Manque de données représentatives
  • Reconnaissance faciale : meilleurs résultats avec un masque blanc
  • Les distributeurs de savon pour les résultats des soins de santé
  • Recommandation : biais codé
1 https://www.ted.com/talks/joy_buolamwini_how_i_m_fighting_bias_in_algorithms
Introduction à l'éthique des données

Un miroir pour nos stéréotypes

Illustration des différents symptômes d’une crise cardiaque pour un homme souffrant d’une constriction thoracique et une femme souffrant de douleurs dorsales.

  • Études et données médicales, historiquement réalisées sur des hommes blancs
  • Par exemple, les symptômes de la crise cardiaque diffèrent entre hommes et femmes
  • Que se passe-t-il si nous utilisons une application de diagnostic utilisant ces données ?
1 https://womeningh.org/
Introduction à l'éthique des données

Un impact important

Capture d’écran d’un diagnostic d’une application de santé pour les symptômes de crise cardiaque pour les hommes et les femmes.

  • Symptômes d’une crise cardiaque : urgence pour un homme, crise de panique pour une femme
Introduction à l'éthique des données

Beaucoup trop et ça ne s'arrête pas là !

Illustration des différents biais cognitifs.

1 CC BY, John Manoogian III (JM3)
Introduction à l'éthique des données

La partie visible de l’iceberg

Illustration de la partie visible d’un iceberg avec des biais statistiques, les biais humains et systématiques en dessous

  • Les biais statistiques : la partie visible de l’iceberg
  • Les préjugés humains et systématiques : changements d’attitude et sociétaux
  • Test de partialité, prévention et atténuation, ouvert au retour d’information
1 Schwartz, R. , Vassilev, A. , Greene, K. , Perine, L. , Burt, A. and Hall, P. (2022), Towards a Standard for Identifying and Managing Bias in Artificial Intelligence, National Institute of Standards and Technology
Introduction à l'éthique des données

Passons à la pratique !

Introduction à l'éthique des données

Preparing Video For Download...