Stockage de données par ligne ou par colonne

Concepts liés aux entrepôts de données

Aaren Stubberfield

Data Scientist

Pourquoi est-ce important ?

  • Optimisation des requêtes pour améliorer la vitesse
  • Le format de stockage en colonnes pour les tables d'entrepôt de données est particulièrement adapté aux charges de travail analytiques
Concepts liés aux entrepôts de données

Principes fondamentaux du stockage informatique

  • Les ordinateurs stockent les données par blocs.
  • Lit les blocs nécessaires lors de la récupération des données.
  • La lecture d'un nombre réduit de blocs accélère la vitesse globale du processus.

Symbolic image of a hard disk with multiple blocks for storage

Concepts liés aux entrepôts de données

Exemple de tableau de santé

  • CDC (Centres pour le contrôle et la prévention des maladies)
  • Données relatives aux infections grippales par tranche d'âge sur plusieurs saisons
SAISON GROUP D’ÂGE POURCENTAGE D'HOSPITALISATION
2019 0-17 ans 13,9 %
2019 18-49 ans 22,5 %
2019 Plus de 50 ans 63,7 %
2020 0-17 ans 3,9 %
2020 18-49 ans 18,1 %
2020 Plus de 50 ans 78 %
2021 0-17 ans 15,6 %
2021 18-49 ans 23,3 %
2021 Plus de 50 ans 61,1 %
Concepts liés aux entrepôts de données

Exemple de stockage en ligne

SAISON GROUP D’ÂGE POURCENTAGE D'HOSPITALISATION
2019 0-17 ans 13,9 %
2019 18-49 ans 22,5 %
2019 Plus de 50 ans 63,7 %
2020 0-17 ans 3,9 %
2020 18-49 ans 18,1 %
2020 Plus de 50 ans 78 %
2021 0-17 ans 15,6 %
2021 18-49 ans 23,3 %
2021 Plus de 50 ans 61,1 %

Symbolic image of a hard disk with multiple blocks for storage with a row stored in each block

Concepts liés aux entrepôts de données

Exemple de stockage en colonnes

SAISON GROUP D’ÂGE POURCENTAGE D'HOSPITALISATION
2019 0-17 ans 13,9 %
2019 18-49 ans 22,5 %
2019 Plus de 50 ans 63,7 %
2020 0-17 ans 3,9 %
2020 18-49 ans 18,1 %
2020 Plus de 50 ans 78 %
2021 0-17 ans 15,6 %
2021 18-49 ans 23,3 %
2021 Plus de 50 ans 61,1 %

Symbolic image of a hard disk with multiple blocks for storage with a column stored in each block

Concepts liés aux entrepôts de données

Récapitulatif

Stockage en ligne

  • Les données en ligne sont regroupées par blocs
  • Idéales pour les charges de travail transactionnelles

Stockage en colonne

  • Les données en colonnes sont regroupées par blocs
  • Idéales pour les charges de travail analytiques
  • Meilleure compression des données
Concepts liés aux entrepôts de données

Il est temps de s'entraîner.

Concepts liés aux entrepôts de données

Preparing Video For Download...