Quelle est la différence entre les entrepôts de données et les lacs de données ?

Concepts liés aux entrepôts de données

Aaren Stubberfield

Data Scientist

Base de données

  • Données structurées en lignes et colonnes
  • Les bases de données transactionnelles stockent les transactions

Three database tables

Concepts liés aux entrepôts de données

Entrepôt de données

  • Collecter des données, les intégrer et les rendre disponibles pour analyse
  • Diverses sources de données d'entrée
  • Stocke des données structurées
  • Difficile à modifier
    • Les effets en amont et en aval doivent être pris en considération
  • Généralement supérieur à 100 Go

Three database tables feeding into a data warehouse

Concepts liés aux entrepôts de données

Pourquoi un entrepôt de données ?

  • À quelle vitesse la requête s'exécutera-t-elle sur une grande quantité de données ?
  • Éviter de ralentir la base de données transactionnelle

Person frustrated by slow data

Concepts liés aux entrepôts de données

Magasins de données

  • Une base de données relationnelle pour l'analyse
  • Les données sont centrées sur un domaine spécifique
  • Peu de sources de données d'entrée
  • Généralement inférieur à 100 Go

Data warehouse feeding a data mart

Concepts liés aux entrepôts de données

Lac de données

  • Ensemble des données stockées par l'organisation
    • Contient des données provenant de plusieurs services
    • Diverses sources de saisie de données
    • Généralement supérieur à 100 Go
  • Stocke des données structurées et non structurées
    • Exemples : vidéo, audio et documents

An audio and video file along with database feeding a data lake

Concepts liés aux entrepôts de données

Lac de données

  • Moins complexe pour apporter des modifications
    • Moins d'effets en amont et en aval à prendre en considération
  • L'objectif du stockage des données peut ne pas être connu
    • Moins organisé

an audio and video file along with database feeding a data lake

Concepts liés aux entrepôts de données

Récapitulatif

Caractéristique Entrepôt de données Magasin de données Lac de données
Structure des données Structurées Structurées Structuré et non structuré
Complexité pour le changement Complexe Complexe Moins complexe
Objectif des données Reconnu Reconnu Peut ne pas être connu
Couverture des départements Couvre un grand nombre Couvre uniquement un seul Couvre un grand nombre
Sources de données De nombreux systèmes sources Peu de sources De nombreux systèmes sources
Taille standard >100 Go <100 Go >100 Go
Concepts liés aux entrepôts de données

Passons à la pratique !

Concepts liés aux entrepôts de données

Preparing Video For Download...