Computação paralela

Introdução à Engenharia de Dados

Hadrien Lacroix

Content Developer at DataCamp

Computação paralela

  • Base das ferramentas modernas de processamento de dados
  • Necessária:
    • Principalmente por causa da memória
    • Também pela capacidade de processamento
  • Como funciona:
    • Divisão das tarefas em várias subtarefas menores
    • Distribuição dessas subtarefas em vários computadores
Introdução à Engenharia de Dados

mil camisetas

Introdução à Engenharia de Dados

assistente de vendas sênior

Introdução à Engenharia de Dados

assistente de vendas júnior

1 Emojis de Mohamed Hassan
Introdução à Engenharia de Dados

um assistente de vendas por vez

Introdução à Engenharia de Dados

camisetas em lote

Introdução à Engenharia de Dados

assistentes de vendas júnior terminando em uma hora e quinze minutos

Introdução à Engenharia de Dados

assistentes de vendas sênior terminando em duas horas e treze minutos

Introdução à Engenharia de Dados

Benefícios e riscos da computação paralela

  • Funcionários = unidades de processamento
  • Vantagens
    • Mais capacidade de processamento
    • Menos quantidade de memória
  • Desvantagens
    • A movimentação de dados acarreta um custo
    • Tempo de comunicação
Introdução à Engenharia de Dados

comparação do desempenho de assistentes de vendas juniores e seniores

Introdução à Engenharia de Dados

leva dez minutos para distribuir as mil camisetas para os quatro assistentes juniores

Introdução à Engenharia de Dados

leva cinco minutos para juntar as camisetas dos quatro assistentes juniores em uma única pilha

Introdução à Engenharia de Dados

pipeline de dados

Introdução à Engenharia de Dados

pipeline de dados

Introdução à Engenharia de Dados

Resumo

  • Benefícios e riscos
  • Como é a implementação na Spotflix
Introdução à Engenharia de Dados

Vamos praticar!

Introdução à Engenharia de Dados

Preparing Video For Download...