Wat doen we met databias?

Introductie tot data-ethiek

Shalini Kurapati, PhD

Co-founder and CEO, Clearbox AI

Wat is bias?

Illustratie van een bevooroordeeld oordeel.

  • Eerste thema in data-ethiek
  • Vooroordeel: voor of tegen persoon, groep of idee — oneerlijk
  • In data-ethiek: databias
  • Onder-, over- of misrepresentatie
  • Schadelijk bij datagedreven beslissingen
1 Icon made by noomtah from www.flaticon.com
Introductie tot data-ethiek

Altijd en overal

  • In alle fasen van data- en levenscycli
  • Dataverzameling
  • Opschonen, voorbereiding, ontwikkeling
  • Datalabeling

Illustratie van databias in verschillende fasen van de datalevenscyclus die leiden tot bevooroordeelde algoritmen

Introductie tot data-ethiek

Dataspecifieke biases

  • Technische of statistische proces-bias

    • Steekproefbias: representatie
    • Meetbias
    • Zelfrapportagebias
    • Labelbias
  • Menselijke en systemische bias

    • Gender
    • Etniciteit/minderheden
    • Cultuur

Illustratie van een scheef object versus het echte beeld.

1 Icon made by Flowicon from www.flaticon.com
Introductie tot data-ethiek

Representatie is cruciaal

Screenshot van Joy’s Ted Talk met een foto waarop ze een wit masker draagt

  • Gebrek aan representatieve data
  • Gezichtsherkenning: betere resultaten met wit masker
  • Van zeepdispensers tot zorguitkomsten
  • Aanrader: Coded Bias
1 https://www.ted.com/talks/joy_buolamwini_how_i_m_fighting_bias_in_algorithms
Introductie tot data-ethiek

Spiegel van onze stereotypen

Illustratie van verschillende hartaanvalsymptomen: man met borstdruk en vrouw met rugpijn.

  • Medische studies en data: historisch vooral witte mannen
  • Bijv. hartaanvalsymptomen verschillen per geslacht
  • Wat als een diagnose-app deze data gebruikt?
1 https://womeningh.org/
Introductie tot data-ethiek

Ernstige impact

Screenshot van een diagnose in een zorgapp voor hartaanvalsymptomen bij mannen en vrouwen.

  • Hartaanvalsymptomen: spoed voor man, paniekaanval voor vrouw
Introductie tot data-ethiek

Veel te veel — en het worden er meer!

Illustratie van diverse cognitieve biases.

1 CC BY, John Manoogian III (JM3)
Introductie tot data-ethiek

Topje van de ijsberg

Illustratie van een ijsberg: statistische biases aan de top, menselijke en systemische biases eronder

  • Statistische bias: topje van de ijsberg
  • Menselijke en systemische bias: houding en maatschappij
  • Testen, voorkomen en mitigeren; open voor feedback
1 Schwartz, R. , Vassilev, A. , Greene, K. , Perine, L. , Burt, A. and Hall, P. (2022), Towards a Standard for Identifying and Managing Bias in Artificial Intelligence, National Institute of Standards and Technology
Introductie tot data-ethiek

Laten we oefenen!

Introductie tot data-ethiek

Preparing Video For Download...