Datenbereinigung und -vorbereitung

Einstieg in Power Query in Excel

Lyndsay Girard

Performance Analytics Consultant

ETL_Schematic_1bof4.jpg

Einstieg in Power Query in Excel

ETL_Schematic_2bof4.jpg

Einstieg in Power Query in Excel

ETL_Schematic_3bof4.png

Einstieg in Power Query in Excel

ETL_Schematic_3cof4.png

Einstieg in Power Query in Excel

ETL_Schematic_4of4.png

Einstieg in Power Query in Excel

Relevanz sauberer Daten

  • Sorgt für Genauigkeit und Zuverlässigkeit
  • Verbesser Effizienz und Effektivität der Analyse
  • Verbessert die Konsistenz und Vergleichbarkeit
  • Fördert Integrität

Bild einer Frau, die Reinigungsmittel über einem Laptop-Bildschirm hält

Einstieg in Power Query in Excel

Fehlende Daten

Umgang mit fehlenden Daten

  • Relevanz der Daten

Ch2_TableWithMissingData.png

Einstieg in Power Query in Excel

Fehlende Daten

Umgang mit fehlenden Daten

  • Relevanz der Daten
  • Datenvolumen

Ch2_TableWithMissingData.png

Ch2_TableWithMissingData_highlighted.png

Einstieg in Power Query in Excel

Fehlende Daten

Umgang mit fehlenden Daten

  • Relevanz der Daten
  • Datenvolumen
  • Datenquelle

Ch2_TableWithMissingData.png

Ch2_TableWithMissingData_highlighted.png

Einstieg in Power Query in Excel

Fehlende Daten

Umgang mit fehlenden Daten

  • Relevanz der Daten
  • Datenvolumen
  • Datenquelle

Ch2_TableWithMissingData.png

Ch2_TableWithMissingData_Imputed.png

Einstieg in Power Query in Excel

Ausreißer und Eingabefehler

Ausreißer

  • Datenpunkte, die stark von den meisten Werten in einem Datensatz abweichen.
  • Tippfehler (Eingabefehler) oder echte Werte

Umgang mit Ausreißern

  • Einfluss auf die Analyse berücksichtigen
  • Imputation

Ch2_Scatter_Outlier_with_arrow.png

Einstieg in Power Query in Excel

Doppelte Daten

Warum sind doppelte Daten ein Problem?

  • Ungenaue Daten
  • Erhöhter Speicher- und Verarbeitungsaufwand
  • Datenintegrität

Ch2_TableWithDuplicateData_highlighted.png

Einstieg in Power Query in Excel

Doppelte Daten

Warum sind doppelte Daten ein Problem?

  • Ungenaue Daten
  • Erhöhter Speicher- und Verarbeitungsaufwand
  • Datenintegrität

Ch2_TableWithDuplicateData_strikethrough.png

Ch2_TableWithDuplicateData_deleted.png

Einstieg in Power Query in Excel

Lass uns üben!

Einstieg in Power Query in Excel

Preparing Video For Download...