Wie gehen wir mit Datenverzerrungen um?

Einführung in die Datenethik

Shalini Kurapati, PhD

Co-founder and CEO, Clearbox AI

Was ist Voreingenommenheit?

Illustration eines voreingenommenen Urteils

  • Erster Gedanke zur Datenethik
  • Vorurteil, für oder gegen eine Person, Gruppe oder Idee – unfair
  • Datenethik – Datenverzerrung
  • Unter-, Über- oder Falschrepräsentation
  • Schädliche Auswirkungen, wenn verzerrte Daten zur Entscheidungsfindung verwendet werden
1 Icon erstellt von noomtah aus www.flaticon.com
Einführung in die Datenethik

Jederzeit und überall

  • In allen Phasen des Daten- und Lebenszyklus
  • Datenerhebung
  • Datenbereinigung, -aufbereitung, -entwicklung
  • Datenbeschriftung

Veranschaulichung von Datenverzerrungen in verschiedenen Phasen des Datenlebenszyklus, die in verzerrte Algorithmen einfließen

Einführung in die Datenethik

Datenspezifische Verzerrungen

  • Technische Prozessverzerrung

    • Stichprobenverzerrung – Repräsentation
    • Verzerrung der Messung
    • Verzerrung durch Selbstauskunft
    • Voreingenommenheit bei Beschriftung
  • Menschliche und syst. Verzerrungen

    • Geschlecht
    • Ethnizität/Minderheiten
    • Kultur

Illustration eines schiefen Objekts im Vergleich zu seinem realen Bild

1 Icon erstellt von Flowicon aus www.flaticon.com
Einführung in die Datenethik

Repräsentation ist entscheidend

Screenshot des Ted Talks von Joy mit einem Foto, auf dem sie eine weiße Maske trägt

  • Mangel an repräsentativen Daten
  • Gesichtserkennung – bessere Ergebnisse mit einer weißen Maske
  • Handseifenspender und Gesundheitsergebnisse
  • Empfohlen: Codierte Verzerrung
1 https://www.ted.com/talks/joy_buolamwini_how_i_m_fighting_bias_in_algorithms
Einführung in die Datenethik

Ein Spiegel für unsere Klischees

Darstellung der verschiedenen Symptome eines Herzinfarkts bei einem Mann mit Brustverengung und einer Frau mit Rückenschmerzen

  • Medizinische Studien und Daten von weißen Männern in der Vergangenheit
  • Z. B. Herzinfarktsymptome sind bei Männern und Frauen unterschiedlich
  • Was passiert, wenn wir eine Diagnose-App mit diesen Daten verwenden?
1 https://womeningh.org/
Einführung in die Datenethik

Schwerwiegende Auswirkungen

Screenshot der Diagnose einer Gesundheits-App für Herzinfarktsymptome für Männer und Frauen

  • Herzinfarktsymptome – Notfall für einen Mann, Panikattacke für eine Frau
Einführung in die Datenethik

Viel zu viele und es werden immer mehr!

Illustration der verschiedenen kognitiven Verzerrungen

1 CC BY, John Manoogian III (JM3)
Einführung in die Datenethik

Die Spitze des Eisbergs

Illustration einer Eisbergspitze mit statistischen Verzerrungen mit den menschlichen und systematischen Verzerrungen unten

  • Statistische Verzerrungen – die Spitze des Eisbergs
  • Menschliche und systematische Voreingenommenheit – Einstellung und Wandel
  • Test auf Voreingenommenheit, Prävention und Abschwächung, offen für Feedback
1 Schwartz, R. , Vassilev, A. , Greene, K. , Perine, L. , Burt, A. and Hall, P. (2022), Towards a Standard for Identifying and Managing Bias in Artificial Intelligence, National Institute of Standards and Technology
Einführung in die Datenethik

Lass uns üben!

Einführung in die Datenethik

Preparing Video For Download...