Modélisation dimensionnelle

Modélisation des données dans Power BI

Sara Billen

Curriculum Manager at DataCamp

Le Modèle Kimball

Le modèle dimensionnel

Couverture du livre The Data Warehouse Toolkit co-écrit par Ralph Kimball

Modélisation des données dans Power BI

Le Modèle Kimball

  • Concepts clés
    • Faits  : mesures issues d’un processus métier
  • Dimensions : contexte entourant un processus métier
  • À combiner pour former un schéma en étoile
  • Les schémas en étoile sont utilisés dans les entrepôts de données
  • Power BI est optimisé pour les schémas en étoile
    • Dimensions: context surrounding a business process
    • Combine to form a star schema
  • Star schemas are used in data warehouses
  • Power BI is optimized for star schemas

Diagramme d’un schéma en étoile avec un fait entouré de cinq dimensions

Modélisation des données dans Power BI

Tables de faits

  • Composé de
    • Faits (mesures)
      • Mesures ou indicateurs issus de votre processus métier
    • Clés
      • Utilisé pour établir des relations entre les tables de faits et de dimensions
  • Les tables de faits sont longues et étroites
  • Beaucoup de lignes
    • Moins de colonnes{{6}} - Fewer columns

Diagramme d’un schéma en étoile avec un fait entouré de cinq dimensions

Modélisation des données dans Power BI

"Tables de faits : un exemple"

Table des ventes de propriété

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200530 PG20 P2 SA6 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modélisation des données dans Power BI

"Tables de faits : un exemple"

Clés: établissent des relations entre les tables

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modélisation des données dans Power BI

"Tables de faits : un exemple"

Mesures : indicateurs issus du processus métier

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modélisation des données dans Power BI

Tables de dimensions

  • Fournir du contexte
    • Qui, quoi, quand, où, pourquoi ?
  • Concepts métier partagés
  • Par exemple, personne, employé, client, fournisseur
  • Contiennent des données statiques ou « à évolution lente »
    • Par exemple, nom, date de naissance, taille
  • Les tables de dimension sont courtes et larges
  • Peu de lignes
    • Beaucoup de colonnes
  • Dimension tables are short and wide
    • Few rows
    • Lots of columns

Diagramme d’un schéma en étoile avec un fait entouré de cinq dimensions

Modélisation des données dans Power BI

"Tables de dimension : un exemple"

Table des commerciaux

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ...
Modélisation des données dans Power BI

"Tables de dimension : un exemple"

Clé: établir la relation avec la table des faits

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ...
Modélisation des données dans Power BI

"Tables de dimension : un exemple"

"Attributs : diverses caractéristiques des dimensions | SalesPersonID | FirstName | LastName | DateOfBirth | Salary | |---------------|-----------|----------|-------------|--------| | SA9 | Mary | Howe | 1990-02-19 | 24000 | | SA12 | David | Ford | 1978-03-24 | 18000 | | SA5 | Ann | Beech | 1980-11-10 | 12000 | | SA6 | Julie | Lee | 1985-06-13 | 30000 | | SA9 | John | White | 1965-10-01 | 9000 | | ... | ... | ... | ... | ... |"

Modélisation des données dans Power BI

Modèle de données pour le schéma en étoile des ventes de biens immobiliers

  • Les dimensions sont utilisées dans plusieurs faits
  • Les dimensions ne sont pas reliées à d'autres dimensions
  • Dimensions are used in multiple facts
  • Dimensions do not link to other dimensions
Modélisation des données dans Power BI

L'ensemble de données

Fact

"- Enquête sur les établissements : nombre d’employés, nombre d’entreprises, …

  • Secteur :
    Dimensions
    Code NAICS, groupe d'industrie, sous-secteur, secteur
  • Temps : année, décennie, siècle
  • Âge : âge de l'établissement
  • Géographie : pays, État{{2}} NAICS code, industry group, subsector, sector
  • Time: year, decade, century
  • Age: establishment age
  • Geography: country, state{{2}}"

Photographie d'un tapis roulant dans une usine de bouteilles

Modélisation des données dans Power BI

Passons à la pratique !

Modélisation des données dans Power BI

Preparing Video For Download...