Data opschonen en voorbereiden

Introductie tot Power Query in Excel

Lyndsay Girard

Performance Analytics Consultant

ETL_Schematic_1bof4.jpg

Introductie tot Power Query in Excel

ETL_Schematic_2bof4.jpg

Introductie tot Power Query in Excel

ETL_Schematic_3bof4.png

Introductie tot Power Query in Excel

ETL_Schematic_3cof4.png

Introductie tot Power Query in Excel

ETL_Schematic_4of4.png

Introductie tot Power Query in Excel

Belang van schone data

  • Zorgt voor nauwkeurigheid en betrouwbaarheid
  • Verbetert efficiëntie en effectiviteit van analyses
  • Verhoogt consistentie en vergelijkbaarheid
  • Bevordert integriteit

Afbeelding van vrouw met schoonmaakspullen voor laptopscherm

Introductie tot Power Query in Excel

Ontbrekende data

Ontbrekende data afhandelen

  • Belang/relevantie van data

Ch2_TableWithMissingData.png

Introductie tot Power Query in Excel

Ontbrekende data

Ontbrekende data afhandelen

  • Belang/relevantie van data
  • Datavolume

Ch2_TableWithMissingData.png

Ch2_TableWithMissingData_highlighted.png

Introductie tot Power Query in Excel

Ontbrekende data

Ontbrekende data afhandelen

  • Belang/relevantie van data
  • Datavolume
  • Databron

Ch2_TableWithMissingData.png

Ch2_TableWithMissingData_highlighted.png

Introductie tot Power Query in Excel

Ontbrekende data

Ontbrekende data afhandelen

  • Belang/relevantie van data
  • Datavolume
  • Databron

Ch2_TableWithMissingData.png

Ch2_TableWithMissingData_Imputed.png

Introductie tot Power Query in Excel

Uitschieters en invoerfouten

Uitschieters

  • Waarde(n) die sterk afwijken van de rest van de dataset.
  • Door typefout (invoerfout) of echte waarde.

Uitschieters afhandelen

  • Beoordeel impact op analyse
  • Imputatie

Ch2_Scatter_Outlier_with_arrow.png

Introductie tot Power Query in Excel

Dubbelen

Waarom zijn duplicaten een probleem?

  • Onnauwkeurige data.
  • Meer opslag- en verwerkingskosten.
  • Minder dataintegriteit.

Ch2_TableWithDuplicateData_highlighted.png

Introductie tot Power Query in Excel

Dubbelen

Waarom zijn duplicaten een probleem?

  • Onnauwkeurige data.
  • Meer opslag- en verwerkingskosten.
  • Minder dataintegriteit.

Ch2_TableWithDuplicateData_strikethrough.png

Ch2_TableWithDuplicateData_deleted.png

Introductie tot Power Query in Excel

Laten we oefenen!

Introductie tot Power Query in Excel

Preparing Video For Download...