Nettoyage et préparation des données

Introduction à Power Query dans Excel

Lyndsay Girard

Performance Analytics Consultant

ETL_Schematic_1bof4.jpg

Introduction à Power Query dans Excel

ETL_Schematic_2bof4.jpg

Introduction à Power Query dans Excel

ETL_Schematic_3bof4.png

Introduction à Power Query dans Excel

ETL_Schematic_3cof4.png

Introduction à Power Query dans Excel

ETL_Schematic_4of4.png

Introduction à Power Query dans Excel

Importance de données fiables

  • Garantit l'exactitude et la fiabilité
  • Améliore l'efficacité et l'efficience de l'analyse
  • Améliore la cohérence et la comparabilité
  • Favorise l'intégrité

Image of woman holding cleaning supplies over laptop screen

Introduction à Power Query dans Excel

Données manquantes

Traitement des données manquantes

  • Importance/pertinence des données

Ch2_TableWithMissingData.png

Introduction à Power Query dans Excel

Données manquantes

Traitement des données manquantes

  • Importance/pertinence des données
  • Volume de données

Ch2_TableWithMissingData.png

Ch2_TableWithMissingData_highlighted.png

Introduction à Power Query dans Excel

Données manquantes

Traitement des données manquantes

  • Importance/pertinence des données
  • Volume de données
  • Source des données

Ch2_TableWithMissingData.png

Ch2_TableWithMissingData_highlighted.png

Introduction à Power Query dans Excel

Données manquantes

Traitement des données manquantes

  • Importance/pertinence des données
  • Volume de données
  • Source des données

Ch2_TableWithMissingData.png

Ch2_TableWithMissingData_Imputed.png

Introduction à Power Query dans Excel

Valeurs aberrantes et erreurs de saisie

Valeurs aberrantes

  • Données qui s'écartent considérablement de la majorité des valeurs d'un ensemble de données.
  • En raison d'une erreur de frappe (erreur de saisie) ou de la valeur réelle.

Traitement des valeurs aberrantes

  • Prendre en considération l'impact sur l'analyse
  • Imputer les valeurs

Ch2_Scatter_Outlier_with_arrow.png

Introduction à Power Query dans Excel

Données en double

Pourquoi les données en double constituent-elles un problème ?

  • Inexactitude des données.
  • Augmentation coûts de stockage/traitement.
  • Intégrité des données.

Ch2_TableWithDuplicateData_highlighted.png

Introduction à Power Query dans Excel

Données en double

Pourquoi les données en double constituent-elles un problème ?

  • Inexactitude des données.
  • Augmentation coûts de stockage/traitement.
  • Intégrité des données.

Ch2_TableWithDuplicateData_strikethrough.png

Ch2_TableWithDuplicateData_deleted.png

Introduction à Power Query dans Excel

Passons à la pratique !

Introduction à Power Query dans Excel

Preparing Video For Download...