Architectures d'entrepôts de données

Concepts d'entreposage de données

Aaren Stubberfield

Data Scientist

Inmon - descendant

Image of data warehouse icon

Concepts d'entreposage de données

Inmon - descendant

Image of data warehouse icon

Il est nécessaire de prendre une décision :

  • Concernant toutes les définitions de données, le nettoyage et les règles métier
  • Avant que les données ne soient enregistrées dans l'entrepôt
Concepts d'entreposage de données

Inmon - descendant

image of two database icons with arrows pointing to an arrow labeled ETL which points to data warehouse icon

Concepts d'entreposage de données

Inmon - descendant

image of two database icons with arrows pointing to an arrow labeled ETL which points to data warehouse icon with arrows pointing to two data mart icons with arrows pointing to an icon of a person on a computer, a reporting icon, and magnifying glass icon

Concepts d'entreposage de données

Avantages et inconvénients de l'approche descendante

Avantages :

  • Source unique de vérité pour l'organisation
  • Normalisation = moins de stockage
  • Facilité de modification des magasins pour s'adapter aux changements dans les rapports

Inconvénients :

  • Plus il y a de connexions, plus le temps de réponse est lent
  • Travail préparatoire approfondi
    • Coût de démarrage plus élevé
Concepts d'entreposage de données

Kimball - approche ascendante

Image of two database icons with arrows pointing to an arrow labeled ETL and arrows pointing to two data mart icon

  • Dénormalise les données
  • Focus sur le magasin de données départemental
  • Les données sont transférées directement de l'ETL vers les magasins
Concepts d'entreposage de données

Kimball - approche ascendante

Image of two database icons with arrows pointing to an arrow labeled ETL and arrows pointing to two data mart icon with arrows pointing to a data warehouse icon with arrows pointing to an icon of a person on a computer, a reporting icon, and magnifying glass icon

Concepts d'entreposage de données

Avantages et inconvénients de l'approche ascendante

Avantages :

  • Vitesse de développement initiale
    • Coût de démarrage réduit
  • Dénormalisé = convivial

Inconvénients :

  • Augmentation du temps de traitement ETL
  • Risque accru de doublons
  • Développement continu nécessaire
Concepts d'entreposage de données

Passons à la pratique !

Concepts d'entreposage de données

Preparing Video For Download...