Limpieza y preparación de datos

Introducción a Power Query en Excel

Lyndsay Girard

Performance Analytics Consultant

ETL_Schematic_1bof4.jpg

Introducción a Power Query en Excel

ETL_Schematic_2bof4.jpg

Introducción a Power Query en Excel

ETL_Schematic_3bof4.png

Introducción a Power Query en Excel

ETL_Schematic_3cof4.png

Introducción a Power Query en Excel

ETL_Schematic_4of4.png

Introducción a Power Query en Excel

Importancia de los datos limpios

  • Garantiza precisión y fiabilidad
  • Mejora la eficiencia y la efectividad del análisis
  • Aumenta la consistencia y comparabilidad
  • Refuerza la integridad

Mujer con productos de limpieza frente a la pantalla de un portátil

Introducción a Power Query en Excel

Datos faltantes

Gestión de datos faltantes

  • Importancia/relevancia de los datos

Tabla con datos faltantes

Introducción a Power Query en Excel

Datos faltantes

Gestión de datos faltantes

  • Importancia/relevancia de los datos
  • Volumen de datos

Tabla con datos faltantes

Tabla con datos faltantes resaltada

Introducción a Power Query en Excel

Datos faltantes

Gestión de datos faltantes

  • Importancia/relevancia de los datos
  • Volumen de datos
  • Fuente de datos

Tabla con datos faltantes

Tabla con datos faltantes resaltada

Introducción a Power Query en Excel

Datos faltantes

Gestión de datos faltantes

  • Importancia/relevancia de los datos
  • Volumen de datos
  • Fuente de datos

Tabla con datos faltantes

Tabla con datos faltantes imputados

Introducción a Power Query en Excel

Atípicos y errores de entrada

Atípicos (outliers)

  • Punto(s) que se desvían mucho de la mayoría del conjunto.
  • Por error de tecleo (entrada) o valor real.

Cómo tratarlos

  • Valora el impacto en el análisis
  • Imputación

Dispersión con outlier y flecha

Introducción a Power Query en Excel

Datos duplicados

¿Por qué los duplicados son un problema?

  • Inexactitud de datos.
  • Mayor gasto de almacenamiento y proceso.
  • Integridad de datos.

Tabla con datos duplicados resaltados

Introducción a Power Query en Excel

Datos duplicados

¿Por qué los duplicados son un problema?

  • Inexactitud de datos.
  • Mayor gasto de almacenamiento y proceso.
  • Integridad de datos.

Tabla con datos duplicados tachados

Tabla con datos duplicados eliminados

Introducción a Power Query en Excel

¡Vamos a practicar!

Introducción a Power Query en Excel

Preparing Video For Download...