Modélisation dimensionnelle

Modélisation des données dans Power BI

Sara Billen

Curriculum Manager at DataCamp

Le Modèle Kimball

Le modèle dimensionnel

Couverture du livre The Data Warehouse Toolkit coécrit par Ralph Kimball

Modélisation des données dans Power BI

Le Modèle Kimball

  • Concepts clés
    • Faits : indicateurs issus d’un processus métier
    • Dimensions : contexte entourant un processus métier
    • À combiner pour former un schéma en étoile
  • Les schémas en étoile sont utilisés dans les entrepôts de données
  • Power BI est optimisé pour les schémas en étoile

Schéma en étoile avec un fait entouré de cinq dimensions

Modélisation des données dans Power BI

Tables de faits

  • Composé de
    • Faits (mesures)
      • Mesures ou métriques issues de votre processus métier
    • Clés
      • Utilisé pour établir des relations entre les tables de faits et de dimensions
  • Les tables de faits sont longues et étroites
    • Beaucoup de lignes
    • Moins de colonnes

Diagramme d’un schéma en étoile avec un fait entouré de cinq dimensions

Modélisation des données dans Power BI

Tables de faits : un exemple

Table des ventes immobilières

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200530 PG20 P2 SA6 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modélisation des données dans Power BI

Tables de faits : un exemple

Clés : établir des relations entre les table

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modélisation des données dans Power BI

Tables de faits : un exemple

Mesures : indicateurs issus du processus métier

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modélisation des données dans Power BI

Tables de dimensions

  • Fournir un contexte
    • Qui, quoi, quand, où, pourquoi ?
  • Concepts commerciaux partagés
    • Par exemple, personne, employé, client, fournisseur
  • Contiennent des données statiques ou « à évolution lente »
    • Par exemple, nom, date de naissance, taille
  • Les tables de dimensions sont courtes et larges
    • Peu de lignes
    • Beaucoup de colonnes

Diagramme d'un schéma en étoile avec une table de faits entourée de cinq dimensions

Modélisation des données dans Power BI

Tables de dimension : un exemple

Table des vendeurs

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ...
Modélisation des données dans Power BI

Tables de dimension : un exemple

Clé : établir une relation avec la table des faits

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ...
Modélisation des données dans Power BI

Tables de dimension : un exemple

Attributs : diverses caractéristiques de la dimension

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ... ... ...
Modélisation des données dans Power BI

Modèle de données pour le schéma en étoile des ventes immobilières

  • Les dimensions sont utilisées dans plusieurs faits
  • Les dimensions ne sont pas reliées à d'autres dimensions
Modélisation des données dans Power BI

L'ensemble de données

Fait
  • Enquête sur les établissements : nombre d’employés, nombre d’entreprises, ...
Dimensions
  • Secteur : Code NAICS, groupe industriel, sous-secteur, secteur
  • Temps : année, décennie, siècle
  • Âge : âge de l’établissement
  • Géographie : pays, État

Photographie d’un convoyeur dans une usine de bouteilles

Modélisation des données dans Power BI

À l’action !

Modélisation des données dans Power BI

Preparing Video For Download...