Integración de datos

Diseño de bases de datos

Lis Sulmont

Curriculum Manager

¿Qué es la integración de datos?

 

 

 

La integración de datos combina datos de diferentes fuentes, formatos y tecnologías para proporcionar a los usuarios una visión traducida y unificada de esos datos.

Diseño de bases de datos

Ejemplos de casos empresariales

  • Visión de 360 grados del cliente
  • Adquisición
  • Sistemas heredados
Diseño de bases de datos

Modelo de datos unificado

Icono de base de datos que representa un modelo de datos unificado

Diseño de bases de datos

Fuentes de datos

Tres fuentes de datos sin conexión con el modelo de datos unificado

Diseño de bases de datos

Formato de las fuentes de datos

Tres fuentes de datos sin conexiones con el modelo de datos unificado y con formatos diferentes

Diseño de bases de datos

Formato de modelo de datos unificado

Tres fuentes de datos con formatos diferentes no conectadas al modelo de datos unificado, que es un almacén de datos Redshift

Diseño de bases de datos

Ejemplo: DataCamp

Tres fuentes de datos con diferentes formatos y procedentes de diferentes departamentos, sin conexión con el modelo de datos unificado, que es un almacén de datos Redshift

Diseño de bases de datos

Cadencia de actualización: ventas

Las tres fuentes de datos se actualizan diariamente

Diseño de bases de datos

Cadencia de actualización: tráfico aéreo

Las tres fuentes de datos se actualizan en tiempo real

Diseño de bases de datos

Diferentes cadencias de actualización

Las tres fuentes de datos se actualizan en momentos diferentes

Diseño de bases de datos

¿Y ya está?

Las tres fuentes de datos se conectan al modelo de datos unificado

Diseño de bases de datos

La verdad es que no.

Las tres fuentes de datos que se actualizan diariamente con una gran X sobre ellas

Diseño de bases de datos

Transformaciones

Las tres fuentes de datos que se están transformando para adaptarse al modelo de datos unificado

Diseño de bases de datos

Transformación: herramientas

Procesamiento de las tres fuentes de datos mediante ETL al modelo de datos unificado

Diseño de bases de datos

Elegir una herramienta de integración de datos

  • Flexibles
  • Fiables
  • Escalables
Diseño de bases de datos

Pruebas automatizadas y alertas proactivas

Diagrama ETL con iconos de prueba en cada fase

Diseño de bases de datos

Seguridad

Diagrama ETL que muestra las partes de los datos que deben restringirse desde su origen hasta su destino

Diseño de bases de datos

Seguridad: anonimización de tarjetas de crédito

Diagrama ETL con anonimización de datos de tarjetas de crédito

Diseño de bases de datos

Gobernanza de datos: linaje

Diagrama ETL con una línea que representa el flujo de datos desde su origen hasta su destino

Diseño de bases de datos

¡Vamos a practicar!

Diseño de bases de datos

Preparing Video For Download...