Pipeline de dados

Introdução à Engenharia de Dados

Hadrien Lacroix

Content Developer at DataCamp

Se os dados são o novo óleo...

os dados são o novo petróleo – capa da The Economist

1 The Economist, 2017-05-06, de David Parkins
Introdução à Engenharia de Dados

poço de petróleo

Introdução à Engenharia de Dados

tubulação do poço de petróleo

Introdução à Engenharia de Dados

destilação

Introdução à Engenharia de Dados

resíduos

Introdução à Engenharia de Dados

óleo pesado

Introdução à Engenharia de Dados

diesel

Introdução à Engenharia de Dados

querosene

Introdução à Engenharia de Dados

nafta

Introdução à Engenharia de Dados

gasolina

Introdução à Engenharia de Dados

o querosene é entregue diretamente no aeroporto

Introdução à Engenharia de Dados

a gasolina é entregue à unidade de armazenamento de combustíveis

Introdução à Engenharia de Dados

a gasolina é entregue da unidade de armazenamento de combustíveis aos postos de gasolina

Introdução à Engenharia de Dados

A nafta passa por transformações químicas

Introdução à Engenharia de Dados

o plástico é enviado para a fábrica

Introdução à Engenharia de Dados

De volta à engenharia de dados

  • Dar entrada
  • Processar
  • Armazenar
  • Necessidade de pipelines
  • Automatizar o fluxo de uma estação para outra
  • Disponibilizar dados atualizados, precisos e relevantes

$$

engenheiro-de-dados

Introdução à Engenharia de Dados

celular

Introdução à Engenharia de Dados

computador

Introdução à Engenharia de Dados

site

Introdução à Engenharia de Dados

tubos do aplicativo móvel, do aplicativo para computador e do site

Introdução à Engenharia de Dados

rack de dados

Introdução à Engenharia de Dados

artistas

Introdução à Engenharia de Dados

álbuns

Introdução à Engenharia de Dados

faixas

Introdução à Engenharia de Dados

listas de reprodução

Introdução à Engenharia de Dados

clientes

Introdução à Engenharia de Dados

funcionários

Introdução à Engenharia de Dados

Banco de dados de artistas

Introdução à Engenharia de Dados

funcionários de vendas

Introdução à Engenharia de Dados

funcionários de engenharia

Introdução à Engenharia de Dados

funcionários de atendimento

Introdução à Engenharia de Dados

Funcionários de vendas dos Estados Unidos

Introdução à Engenharia de Dados

Funcionários de vendas da Bélgica

Introdução à Engenharia de Dados

Funcionários de vendas da França

Introdução à Engenharia de Dados

verificar e limpar as faixas

Introdução à Engenharia de Dados

gravar faixas limpas no banco de dados

Introdução à Engenharia de Dados

Introdução à Engenharia de Dados

Introdução à Engenharia de Dados

Introdução à Engenharia de Dados

Introdução à Engenharia de Dados

Introdução à Engenharia de Dados

Introdução à Engenharia de Dados

Introdução à Engenharia de Dados

Introdução à Engenharia de Dados

Introdução à Engenharia de Dados

Oprah distribuindo pipelines

Introdução à Engenharia de Dados

Oprah distribuindo pipelines

Introdução à Engenharia de Dados

Oprah distribuindo pipelines

Introdução à Engenharia de Dados

Os pipelines de dados garantem um fluxo eficiente dos dados

Automatizam

  • Extração
  • Transformação
  • Combinação
  • Validação
  • Carregamento

Reduzem

  • Intervenção humana
  • Erros
  • Tempo necessário para movimentação dos dados
Introdução à Engenharia de Dados

ETL e pipelines de dados

ETL

  • Estrutura muito utilizada para projetar pipelines de dados
  • 1) Extrair dados
  • 2) Transformar dados extraídos
  • 3) Carregar dados transformados para outro banco de dados

Pipelines de dados

  • Movimentam dados de um sistema para outro
  • Podem seguir o ETL
  • Os dados nem sempre são transformados
  • Os dados podem ser carregados diretamente nos aplicativos
Introdução à Engenharia de Dados

Resumo

  • O que é um pipeline de dados
  • Para que serve
  • Por que é importante
  • Como os pipelines de dados são implementados na Spotflix
  • O que é ETL e suas nuances
Introdução à Engenharia de Dados

Vamos praticar!

Introdução à Engenharia de Dados

Preparing Video For Download...