Calidad de datos e ingesta

Conceptos de MLOps

Folkert Stijnman

ML Engineer

Calidad de datos e ingesta

Ciclo de vida de ML: adquisición de datos

Conceptos de MLOps

¿Qué es la calidad de datos?

  • La calidad mide cómo de bien los datos cumplen su propósito
  • Se evalúa en varias dimensiones
  • La calidad del modelo ML depende de los datos
Conceptos de MLOps

Dimensiones de la calidad de datos

  • Exactitud
  • Completitud
  • Consistencia
  • Actualidad
Conceptos de MLOps

Ejemplo de dimensiones de calidad

Dimensión Pregunta a responder Ejemplo de la dimensión
Exactitud ¿Nuestros datos describen bien al cliente? La edad del cliente en los datos es 18, pero en realidad es 32.
Completitud ¿Falta algún dato del cliente? Al 80% de los clientes les falta el apellido.
Consistencia ¿La definición de cliente está alineada en toda la empresa? El cliente aparece activo en una base de datos y no activo en otra.
Actualidad ¿Cuándo están disponibles los pedidos del cliente? Los pedidos se sincronizan al final del día y no están en tiempo real.

¡La baja calidad de datos no es el fin del proyecto!

Conceptos de MLOps

Ingesta de datos

Canal de datos

Conceptos de MLOps

¡Vamos a practicar!

Conceptos de MLOps

Preparing Video For Download...