Modelado dimensional

Modelado de datos en Power BI

Sara Billen

Curriculum Manager at DataCamp

El modelo Kimball

El modelo dimensional

Portada del libro The Data Warehouse Toolkit, coescrito por Ralph Kimball

Modelado de datos en Power BI

El modelo Kimball

  • Conceptos clave
    • Hechos: métricas de un proceso de negocio
    • Dimensiones: contexto del proceso de negocio
    • Se combinan en un esquema en estrella
  • Los esquemas en estrella se usan en data warehouses
  • Power BI está optimizado para esquemas en estrella

Diagrama de un esquema en estrella con un hecho rodeado por cinco dimensiones

Modelado de datos en Power BI

Tablas de hechos

  • Se compone de
    • Hechos (medidas)
      • Mediciones o métricas de tu proceso de negocio
    • Claves
      • Para crear relaciones entre tablas de hechos y de dimensión
  • Las tablas de hechos son largas y estrechas
    • Muchas filas
    • Menas columnas

Diagrama de un esquema en estrella con un hecho rodeado por cinco dimensiones

Modelado de datos en Power BI

Tablas de hechos: ejemplo

Tabla Ventas de Propiedades

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200530 PG20 P2 SA6 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modelado de datos en Power BI

Tablas de hechos: ejemplo

Claves: establecen relaciones entre tablas

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modelado de datos en Power BI

Tablas de hechos: ejemplo

Medidas: métricas del proceso de negocio

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modelado de datos en Power BI

Tablas de dimensión

  • Dan contexto
    • ¿Quién, qué, cuándo, dónde, por qué?
  • Conceptos de negocio compartidos
    • P. ej., persona, empleado, cliente, proveedor
  • Datos estáticos o "de cambio lento"
    • P. ej., nombre, fecha de nacimiento, altura
  • Las tablas de dimensión son cortas y anchas
    • Pocas filas
    • Muchas columnas

Diagrama de un esquema en estrella con un hecho rodeado por cinco dimensiones

Modelado de datos en Power BI

Tablas de dimensión: ejemplo

Tabla de vendedores

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ...
Modelado de datos en Power BI

Tablas de dimensión: ejemplo

Clave: establece relación con la tabla de hechos

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ...
Modelado de datos en Power BI

Tablas de dimensión: ejemplo

Atributos: características de la dimensión

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ... ... ...
Modelado de datos en Power BI

Modelo de datos del esquema en estrella de Ventas de Propiedades

  • Las dimensiones se usan en varios hechos
  • Las dimensiones no se enlazan entre sí
Modelado de datos en Power BI

El conjunto de datos

Hecho
  • Encuesta de establecimientos: número de empleados, número de empresas, ...
Dimensiones
  • Industria: código NAICS, grupo, subsector, sector
  • Tiempo: año, década, siglo
  • Edad: antigüedad del establecimiento
  • Geografía: país, estado

Fotografía de una cinta transportadora en una fábrica de botellas

Modelado de datos en Power BI

¡Vamos a practicar!

Modelado de datos en Power BI

Preparing Video For Download...