Metadatos y calidad de datos

Introducción a la calidad de datos

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

¿Qué son los metadatos?

Metadatos: datos sobre los datos, o atributos que describen los datos

  • Se utilizan para organizar y comprender conjuntos de datos y elementos de datos
  • Se utilizan en el proceso de calidad de los datos para determinar lo siguiente:
    • definición de un campo
    • propietario de un campo
    • fecha de última actualización del campo

ejemplos de definición de metadatos, propietario de los datos, fecha de actualización

Introducción a la calidad de datos

Ejemplos de metadatos

Los metadatos pueden encontrarse en un diccionario de datos.

Ejemplos:

  • Nombre del campo empresarial
  • Definición de empresa
  • Propietario de los datos
  • Nombre del campo físico técnico

ejemplo de metadatos en catálogo de datos

Introducción a la calidad de datos

¿Qué es el linaje de datos?

Linaje de los datos: una representación de cómo se mueven los datos en una canalización, desde que se introducen en la fuente, pasando por cada paso de la canalización de datos, hasta que se consumen.

ejemplo de linaje de datos

  • Cada capa tiene sus propios metadatos
  • Se utiliza en el proceso de calidad de datos para determinar dónde aplicar una norma de calidad de datos
Introducción a la calidad de datos

Ejemplo de linaje de datos

ejemplo detallado de linaje de datos

Introducción a la calidad de datos

Ejemplo de metadatos y linaje de datos

ejemplo de linaje de datos

Introducción a la calidad de datos

Ejemplo de mala práctica con los metadatos y el linaje de datos

ejemplo de linaje de datos

Introducción a la calidad de datos

Ejemplo de buena práctica con los metadatos y el linaje de datos

ejemplo de linaje de datos

Introducción a la calidad de datos

¡Vamos a practicar!

Introducción a la calidad de datos

Preparing Video For Download...