¿Qué hacemos con los sesgos de los datos?

Introducción a la ética de los datos

Shalini Kurapati, PhD

Co-founder and CEO, Clearbox AI

¿Qué es el sesgo?

Ilustración de un juicio sesgado.

  • Primera reflexión sobre la ética de los datos
  • Prejuicios, a favor o en contra de una persona, grupo o idea: injustos
  • Ética de los datos: sesgo de los datos
  • Representación insuficiente, excesiva o errónea
  • Efectos perjudiciales si se utilizan datos sesgados en la toma de decisiones
1 Icono hecho por noomtah de www.flaticon.com
Introducción a la ética de los datos

En cualquier momento y lugar

  • En todas las fases de los datos y ciclos de vida
  • Recopilación de datos
  • Limpieza, preparación y desarrollo de datos
  • Etiquetado de datos

Ilustración de los sesgos de los datos en diferentes etapas del ciclo de vida de los datos que alimentan los algoritmos sesgados

Introducción a la ética de los datos

Sesgos específicos de los datos

  • Sesgo del proceso técnico o estadístico

    • Sesgo de muestreo: representación
    • Sesgo de medición
    • Sesgo de autoinforme
    • Sesgo de etiquetado
  • Sesgo humano y sistemático

    • Género
    • Etnia/minorías
    • Cultura

Ilustración de un objeto sesgado frente a su imagen real.

1 Icono realizado por Flowicon a partir de www.flaticon.com
Introducción a la ética de los datos

La representación es crucial

Captura de pantalla de la charla en TED de Joy con una foto suya donde lleva una máscara blanca

  • Falta de datos representativos
  • Reconocimiento facial: mejores resultados con una máscara blanca
  • Los dispensadores de jabón de manos para los resultados sanitarios
  • Recomendado: sesgo codificado
1 https://www.ted.com/talks/joy_buolamwini_how_i_m_fighting_bias_in_algorithms
Introducción a la ética de los datos

Un reflejo de nuestros estereotipos

Ilustración de los distintos síntomas de un infarto de miocardio en un hombre con constricción torácica y una mujer con dolor de espalda.

  • Estudios y datos médicos, históricamente realizados en varones blancos
  • Por ejemplo, los síntomas del infarto son diferentes en hombres y mujeres
  • ¿Qué ocurre si utilizamos una aplicación de diagnóstico con estos datos?
1 https://womeningh.org/
Introducción a la ética de los datos

Impacto grave

Captura de pantalla de un diagnóstico de una aplicación sanitaria sobre síntomas de infarto para hombres y mujeres.

  • Síntomas de ataque al corazón: emergencia - hombre, ataque de pánico -mujer
Introducción a la ética de los datos

¡Demasiados y cada vez más!

Ilustración de los distintos sesgos cognitivos.

1 CC BY, John Manoogian III (JM3)
Introducción a la ética de los datos

La punta del iceberg

Ilustración de una punta de iceberg con sesgos estadísticos con los sesgos humanos y sistemáticos a continuación

  • Los sesgos estadísticos son la punta del iceberg
  • Prejuicios humanos y sistemáticos: actitud y cambios sociales
  • Prueba de sesgo, prevención y mitigación, abierta a la retroalimentación
1 Schwartz, R. , Vassilev, A. , Greene, K. , Perine, L. , Burt, A. y Hall, P. (2022), Towards a Standard for Identifying and Managing Bias in Artificial Intelligence, National Institute of Standards and Technology
Introducción a la ética de los datos

¡Vamos a practicar!

Introducción a la ética de los datos

Preparing Video For Download...