Arquitecturas de data warehouse

Conceptos de almacenamiento de datos

Aaren Stubberfield

Data Scientist

Inmon - top-down

Imagen de icono de data warehouse

Conceptos de almacenamiento de datos

Inmon - top-down

Imagen de icono de data warehouse

Hay que decidir:

  • Todas las definiciones, limpieza y reglas de negocio
  • Antes de que entre cualquier dato al warehouse
Conceptos de almacenamiento de datos

Inmon - top-down

Imagen de dos iconos de base de datos con flechas hacia una flecha llamada ETL que apunta a un icono de data warehouse

Conceptos de almacenamiento de datos

Inmon - top-down

Imagen de dos iconos de base de datos con flechas hacia una flecha llamada ETL que apunta a un icono de data warehouse con flechas hacia dos iconos de data mart con flechas hacia un icono de persona en un ordenador, un icono de reportes y un icono de lupa

Conceptos de almacenamiento de datos

Pros y contras del enfoque top-down

Ventajas:

  • Fuente única de verdad para la organización
  • Normalización = menos almacenamiento
  • Fácil cambiar data marts para nuevos reportes

Desventajas:

  • Más joins = respuesta más lenta
  • Mucho trabajo inicial
    • Mayor coste de inicio
Conceptos de almacenamiento de datos

Kimball - bottom-up

Imagen de dos iconos de base de datos con flechas hacia una flecha llamada ETL y flechas hacia dos iconos de data mart

  • Desnormaliza los datos
  • Enfoque en el data mart del departamento
  • Los datos van directo de ETL a los data marts
Conceptos de almacenamiento de datos

Kimball - bottom-up

Imagen de dos iconos de base de datos con flechas hacia una flecha llamada ETL y flechas hacia dos iconos de data mart con flechas hacia un icono de data warehouse con flechas hacia un icono de persona en un ordenador, un icono de reportes y un icono de lupa

Conceptos de almacenamiento de datos

Pros y contras del enfoque bottom-up

Ventajas:

  • Desarrollo inicial rápido
    • Menor coste de inicio
  • Desnormalizado = más fácil para usuarios

Desventajas:

  • Más tiempo de procesamiento ETL
  • Mayor riesgo de datos duplicados
  • Desarrollo continuo necesario
Conceptos de almacenamiento de datos

¡Vamos a practicar!

Conceptos de almacenamiento de datos

Preparing Video For Download...