Modélisation des données et propriétés des tables

Modélisation des données dans Power BI

Maarten Van den Broeck

Content Developer at DataCamp

Qu’est-ce qu’un modèle de données ?

  • Vue conceptuelle des éléments de données
  • Représentation visuelle typique
  • Les modèles de données incluent :
    • Tables
    • Colonnes
    • Relations entre les tables
    • Types de données
    • Clés

vue d’ensemble d’un modèle de données

Modélisation des données dans Power BI

Modélisation des données

  • Le processus de création d’un modèle de données

  • Pourquoi modéliser les données ?

    • Les données $\neq$ parfaites
    • Remodeler les données pour l’analyse
    • Compresser l’utilisation des données
    • Modèle plus facile à comprendre

modélisation des données

Modélisation des données dans Power BI

Modélisation des données dans Power BI & Power Query

  • Power Query est l’outil de préparation des données de différents produits Microsoft, y compris Power BI

  • Objectifs principaux :

    • Gestion des requêtes
    • Modélisation des données
  • Modélisation des données : 80 % dans Power Query, 20 % dans Power BI

Modélisation des données dans Power Query

Modélisation des données dans Power BI

Gestion des colonnes et des lignes

Fonctionnement

  • Conserver ou supprimer certaines colonnes
  • Conserver ou supprimer certaines lignes
  • Diviser une seule colonne en plusieurs colonnes
  • Résumer/grouper les lignes dans une table selon le contenu d'une colonne

Exemple

  • Supprimer la colonne vide
  • Garder la première ligne en tête
  • Colonne JJ/MM/AAAA divisée en colonnes JJ, MM, AAAA
  • Somme ou médiane de toutes les lignes
Modélisation des données dans Power BI

Types de données

  • Choisir le bon type de données est essentiel :

    • Contraindre les données à une forme spécifique
    • Optimiser le stockage
    • Activer des fonctionnalités spécifiques
  • Power Query déduit le type de données sur les premières centaines de lignes

Types de données dans Power BI

Modélisation des données dans Power BI

Arrondi

Power Query

  • Modifie réellement les données, pas seulement le formatage
  • Ce n’est généralement pas la bonne réponse

Power BI

  • Modifie la façon dont les données apparaissent_, pas la façon dont elles sont stockées
  • Généralement une meilleure réponse que l’arrondi dans Power Query

Modélisation des données dans Power BI

L'ensemble de données

  • Données d'enquête du United States Census Bureau sur les fabricants
  • Statistiques résumées pour les entreprises manufacturières
  • North American Industry Classification System (NAICS)

Modélisation des données dans Power BI

À l’action !

Modélisation des données dans Power BI

Preparing Video For Download...