¿Qué hacemos con los sesgos de los datos?

Introducción a la ética de los datos

Shalini Kurapati, PhD

Co-founder and CEO, Clearbox AI

¿Qué es el sesgo?

Ilustración de un juicio sesgado.

  • Primera reflexión sobre la ética de datos
  • Prejuicios, a favor o en contra de una persona, grupo o idea: injustos
  • Ética de datos: sesgo de los datos
  • Infrarrepresentación, sobrerrepresentación o mala representación
  • Efectos perjudiciales si se utilizan datos sesgados en la toma de decisiones
1 Icono hecho por noomtah a partir de www.flaticon.com
Introducción a la ética de los datos

En cualquier momento y lugar

  • En todas las fases del ciclo de vida de los datos
  • Recopilación de datos
  • Limpieza, preparación y desarrollo de datos
  • Etiquetado de datos

Ilustración de los sesgos de los datos en diferentes fases del ciclo de vida de los datos que entran en algoritmos sesgados

Introducción a la ética de los datos

Sesgos específicos de los datos

  • Sesgo del proceso técnico o estadístico

    • Sesgo de muestreo: representación
    • Sesgo de medición
    • Sesgo de autoinforme
    • Sesgo de etiquetado
  • Sesgo cognitivo y sistemático

    • Género
    • Etnia/minorías
    • Cultura

Ilustración de un objeto sesgado frente a su imagen real.

1 Icono realizado por Flowicon a partir de www.flaticon.com
Introducción a la ética de los datos

La representación es crucial

Captura de pantalla de la TED talk de Joy con una foto suya en la que lleva una máscara blanca

  • Falta de datos representativos
  • Reconocimiento facial: mejores resultados con una máscara blanca
  • Resultados con dispensadores de jabón de manos o sanidad
  • Recomendado: Sesgo codificado
1 https://www.ted.com/talks/joy_buolamwini_how_i_m_fighting_bias_in_algorithms
Introducción a la ética de los datos

Un reflejo de nuestros estereotipos

Ilustración de los distintos síntomas de un infarto en un hombre con opresión en el pecho y una mujer con dolor de espalda.

  • Estudios y datos médicos, históricamente realizados en hombres blancos
  • Por ejemplo, los síntomas del infarto son diferentes en hombres y mujeres
  • ¿Qué ocurre si utilizamos una aplicación de diagnóstico con estos datos?
1 https://womeningh.org/
Introducción a la ética de los datos

Impacto grave

Captura de pantalla de un diagnóstico de una aplicación sanitaria para síntomas de infarto en hombres y mujeres.

  • Síntomas de infarto: urgencia para un hombre, ataque de pánico para una mujer
Introducción a la ética de los datos

¡Demasiados y cada vez más!

Ilustración de los distintos sesgos cognitivos.

1 CC BY, John Manoogian III (JM3)
Introducción a la ética de los datos

La punta del iceberg

Ilustración de una punta de iceberg con sesgos estadísticos con los sesgos cognitivo y sistemático debajo

  • Los sesgos estadísticos son la punta del iceberg
  • Sesgo cognitivo y sistemático: cambios en las actitudes y la sociedad
  • Prueba de sesgo, prevención y mitigación, apertura a los comentarios
1 Schwartz, R., Vassilev, A., Greene, K., Perine, L., Burt, A. y Hall, P. (2022), Towards a Standard for Identifying and Managing Bias in Artificial Intelligence, National Institute of Standards and Technology
Introducción a la ética de los datos

¡Practiquemos!

Introducción a la ética de los datos

Preparing Video For Download...