Komputasi paralel

Memahami Rekayasa Data

Hadrien Lacroix

Content Developer at DataCamp

Komputasi paralel

  • Dasar alat pemrosesan data modern
  • Diperlukan:
    • Utamanya karena memori
    • Juga untuk daya komputasi
  • Cara kerja:
    • Pecah tugas menjadi beberapa subtugas kecil
    • Sebarkan subtugas ke beberapa komputer
Memahami Rekayasa Data

1000 kaus

Memahami Rekayasa Data

asisten penjualan senior

Memahami Rekayasa Data

asisten penjualan junior

1 Emoji oleh Mohamed Hassan
Memahami Rekayasa Data

satu asisten penjualan pada satu waktu

Memahami Rekayasa Data

membagi kaus oblong per batch

Memahami Rekayasa Data

asisten penjualan junior selesai dalam satu jam lima belas menit

Memahami Rekayasa Data

asisten penjualan senior selesai dalam dua jam tiga belas menit

Memahami Rekayasa Data

Manfaat dan risiko komputasi paralel

  • Karyawan = unit pemrosesan
  • Keuntungan
    • Daya komputasi ekstra
    • Jejak memori lebih kecil
  • Kerugian
    • Pemindahan data berbiaya
    • Waktu komunikasi
Memahami Rekayasa Data

membandingkan kinerja asisten penjualan junior dan senior

Memahami Rekayasa Data

butuh sepuluh menit untuk membagikan seribu kaus ke empat asisten junior

Memahami Rekayasa Data

butuh lima menit untuk mengumpulkan kaus dari empat asisten junior menjadi satu tumpukan

Memahami Rekayasa Data

pipeline data

Memahami Rekayasa Data

pipeline data

Memahami Rekayasa Data

Ringkasan

  • Manfaat dan risiko
  • Implementasi di Spotflix
Memahami Rekayasa Data

Ayo berlatih!

Memahami Rekayasa Data

Preparing Video For Download...