¿Qué es la ingeniería de datos?

Introducción a la ingeniería de datos

Vincent Vankrunkelsven

Data Engineer @ DataCamp

Qué esperar

  • Capítulo 1
    • ¿Qué es la ingeniería de datos?
  • Capítulo 2
    • Herramientas que usa un data engineer
  • Capítulo 3
    • Extract
    • Transform
    • Load
  • Capítulo 4
    • ¡Ingeniería de datos en DataCamp!
Introducción a la ingeniería de datos

Llega el data engineer

 

  • Los datos están dispersos
  • No optimizados para análisis
  • Código heredado causa datos corruptos

 

¡Entra el data engineer al rescate!

Ingeniera

Esquema de base de datos que representa datos dispersos

Imagen que representa un error de computadora

Introducción a la ingeniería de datos

Data engineers: te hacen la vida más fácil

 

  • Reúne datos de distintas fuentes
  • Base de datos optimizada para análisis
  • Elimina datos corruptos

 

¡La vida del data scientist es mucho más fácil!

 

Diagrama del proceso de ingesta de datos

Introducción a la ingeniería de datos

Definición del puesto

Ingeniero que desarrolla, construye, prueba y mantiene arquitecturas como bases de datos y sistemas de procesamiento a gran escala

  • Procesa grandes volúmenes de datos
  • Uso de clústeres de máquinas
Introducción a la ingeniería de datos

Data Engineer vs Data Scientist

Data Engineer

  • Desarrolla arquitectura de datos escalable
  • Agiliza la captura de datos
  • Configura procesos para unificar datos
  • Limpia datos corruptos
  • Domina la nube

Data Scientist

  • Extrae patrones en datos
  • Modelado estadístico
  • Modelos predictivos con machine learning
  • Monitoriza procesos de negocio
  • Limpia outliers
Introducción a la ingeniería de datos

¡Vamos a practicar!

Introducción a la ingeniería de datos

Preparing Video For Download...