Modélisation des données et propriétés des tables

Modélisation des données dans Power BI

Maarten Van den Broeck

Content Developer at DataCamp

Qu’est-ce qu’un modèle de données ?

  • Vue conceptuelle des éléments de données
  • Représentation visuelle typique
  • Les modèles de données incluent :
  • Tables
  • Colonnes
  • Relations entre tables
  • Types de données
  • Clés
  • Typically a visual representation
  • Data models include:
    • Tables
    • Columns
    • Relationships between tables
    • Data types
    • Keys

vue générale d’un modèle de données

Modélisation des données dans Power BI

Modélisation des données

  • Le processus de création d’un modèle de données
  • Pourquoi modéliser les données ?
  • Les données $\neq$ parfaites
  • Remodeler les données pour l’analyse
  • Compresser l’utilisation des données
  • Modèle plus facile à comprendre
  • Why model data?
    • Data $\neq$ perfect
    • Reshape data for analysis
    • Compress data usage
    • Easier to understand model

modélisation des données

Modélisation des données dans Power BI

Modélisation des données dans Power BI & Power Query

  • Power Query est l’outil de préparation des données de différents produits Microsoft, y compris Power BI - Objectifs principaux : {{1}} - Gérer les requêtes {{1}} - Modélisation des données {{1}} - Modélisation des données :

80 % dans Power Query, 20 % dans Power BI

  • Data modeling: 80% in Power Query, 20% in Power BI

Modélisation des données dans Power Query

Modélisation des données dans Power BI

Gestion des colonnes et des lignes

Operation

"- Conserver ou supprimer des colonnes spécifiques

  • Conserver ou supprimer des lignes spécifiques
  • Diviser une seule colonne en plusieurs colonnes
  • Résumer/grouper les lignes dans une table selon le contenu d'une colonne
  • Keep or remove specific rows
  • Split a single column in multiple columns
  • Summarize/group rows in a table by the contents of a column {{3}}"

Example

"- Supprimer la colonne vide

  • Garder la première ligne comme en-tête
  • Colonne JJ/MM/AAAA séparée en colonnes JJ, MM, AAAA
  • Somme ou médiane de toutes les lignes
  • Keep top row as header
  • DD/MM/YYYY column split in DD, MM, YYYY columns
  • Sum or median of all rows {{3}}"
Modélisation des données dans Power BI

Types de données

  • Choisir le bon type de données est essentiel :
  • Contraindre les données à une forme spécifique
  • Optimiser le stockage
  • Activer des fonctionnalités spécifiques
  • Power Query déduit le type de données à partir des premières centaines de lignes

    • Constrain data to a specific shape
    • Optimize storage
    • Enable specific functionality
  • Power Query infers data type on first few hundred rows

Types de données dans Power BI

Modélisation des données dans Power BI

Arrondi

Power Query

"- Modifie réellement les données, pas seulement le formatage

  • Généralement, ce n'est pas la bonne réponse

  • Typically not the right answer

"

Power BI

"- Modifie la façon dont les données apparaissent, mais pas la façon dont elles sont stockées

  • Généralement une meilleure solution que l’arrondi dans Power Query

  • Generally a better answer than rounding in Power Query

{{1}}"

Modélisation des données dans Power BI

L'ensemble de données

  • Données d'enquête du United States Census Bureau sur les fabricants
  • Statistiques récapitulatives pour les entreprises manufacturières
  • North American Industry Classification System (NAICS)

  • Summary statistics for manufacturing firms
  • North American Industry Classification System (NAICS)

Modélisation des données dans Power BI

Passons à la pratique !

Modélisation des données dans Power BI

Preparing Video For Download...