Perfiles de datos

Introducción a la calidad de datos

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

¿Qué es el perfilado de datos?

Perfilado de datos: ejecutar estadísticas para comprender mejor los datos y las dependencias de los campos

Ejemplos:

  • ¿Cuántos registros hay?
  • Valores mínimo y máximo de un elemento.
  • ¿Cuántos registros tienen rellenado un determinado elemento de datos?
  • Cuando se rellena la columna A, ¿qué otras columnas se rellenan también?

ejemplos de perfiles de datos, mín, máx, recuento de nulos

Introducción a la calidad de datos

Importancia del perfilado de datos

Perfilado de datos:

  • Confirma lo que ya sabes
  • Revela lo que no sabes
  • Identifica los problemas de calidad de los datos
  • Ayuda a redactar mejores normas de calidad de datos

tabla de datos con una linterna iluminándola

Introducción a la calidad de datos

¿Qué aspecto tiene un perfil de datos?

![tabla de datos]

Introducción a la calidad de datos

Perfil de los datos del cliente ID

ejemplos de perfiles de datos

Introducción a la calidad de datos

Perfil de datos del nombre del cliente

ejemplos de perfiles de datos

Introducción a la calidad de datos

Perfil de datos de la fecha de nacimiento del cliente

ejemplos de perfiles de datos

Introducción a la calidad de datos

Perfil de datos del tipo de cuenta de cliente

ejemplos de perfiles de datos

Introducción a la calidad de datos

Utilizar un perfil de datos en la calidad de datos

ejemplos de perfiles de datos

  • Los valores de Customer ID, 11 car.
  • CustomerFirstName debe ser cadenas de texto de 1 a 20 car.
  • Valores de CustomerLastName deben ser cadenas de texto de 1 a 30 car.

ejemplos de perfiles de datos

  • CustomerBirthDate es del formato MM/DD/YYYY y entre 01/01/1900 y 99/99/9999.
  • CustomerAccountType contiene Préstamo Depósito, Préstamo y Depósito, o Tarjetaeta.
Introducción a la calidad de datos

¡Vamos a practicar!

Introducción a la calidad de datos

Preparing Video For Download...