Pulizia e preparazione dei dati

Introduzione a Power Query in Excel

Lyndsay Girard

Performance Analytics Consultant

ETL_Schematic_1bof4.jpg

Introduzione a Power Query in Excel

ETL_Schematic_2bof4.jpg

Introduzione a Power Query in Excel

ETL_Schematic_3bof4.png

Introduzione a Power Query in Excel

ETL_Schematic_3cof4.png

Introduzione a Power Query in Excel

ETL_Schematic_4of4.png

Introduzione a Power Query in Excel

Importanza dei dati puliti

  • Garantisce accuratezza e affidabilità
  • Migliora efficienza ed efficacia dell’analisi
  • Aumenta coerenza e confrontabilità
  • Rafforza l’integrità

Immagine di una donna che tiene prodotti per la pulizia davanti allo schermo di un laptop

Introduzione a Power Query in Excel

Dati mancanti

Gestire i dati mancanti

  • Importanza/rilevanza dei dati

Tabella con dati mancanti

Introduzione a Power Query in Excel

Dati mancanti

Gestire i dati mancanti

  • Importanza/rilevanza dei dati
  • Volume dei dati

Tabella con dati mancanti

Tabella con dati mancanti evidenziati

Introduzione a Power Query in Excel

Dati mancanti

Gestire i dati mancanti

  • Importanza/rilevanza dei dati
  • Volume dei dati
  • Fonte dei dati

Tabella con dati mancanti

Tabella con dati mancanti evidenziati

Introduzione a Power Query in Excel

Dati mancanti

Gestire i dati mancanti

  • Importanza/rilevanza dei dati
  • Volume dei dati
  • Fonte dei dati

Tabella con dati mancanti

Tabella con dati mancanti imputati

Introduzione a Power Query in Excel

Outlier ed errori di inserimento

Outlier

  • Punti che deviano molto dalla maggioranza del dataset.
  • Dovuti a typo (errore di inserimento) o valori reali.

Gestione degli outlier

  • Valuta l’impatto sull’analisi
  • Imputazione

Dispersione con outlier e freccia

Introduzione a Power Query in Excel

Dati duplicati

Perché i duplicati sono un problema?

  • Dati inesatti.
  • Più spazio e carico di elaborazione.
  • Integrità dei dati.

Tabella con dati duplicati evidenziati

Introduzione a Power Query in Excel

Dati duplicati

Perché i duplicati sono un problema?

  • Dati inesatti.
  • Più spazio e carico di elaborazione.
  • Integrità dei dati.

Tabella con dati duplicati barrati

Tabella con duplicati eliminati

Introduzione a Power Query in Excel

Passiamo alla pratica!

Introduzione a Power Query in Excel

Preparing Video For Download...