Menjadwalkan data

Memahami Data Engineering

Hadrien Lacroix

Content Developer at DataCamp

Penjadwalan

  • Dapat diterapkan pada tugas apa pun dalam pemrosesan data
  • Penjadwalan adalah perekat sistem Anda
  • Menyatukan komponen dan mengatur cara kerjanya
  • Menjalankan tugas berurutan dan menyelesaikan dependensi
Memahami Data Engineering

Penjadwalan manual, berbasis waktu, dan sensor

  • Manual
  • Perbarui tabel karyawan secara manual
Memahami Data Engineering

pipeline data

Memahami Data Engineering

gambar jam — tabel karyawan diperbarui setiap hari pukul 6 pagi

Memahami Data Engineering

Penjadwalan manual, berbasis waktu, dan sensor

  • Manual
  • Otomatis pada waktu tertentu
  • Otomatis saat kondisi tertentu terpenuhi
    • Penjadwalan sensor
  • Perbarui tabel karyawan secara manual
  • Perbarui tabel karyawan pukul 6 pagi
Memahami Data Engineering

pipeline data

Memahami Data Engineering

gambar sensor memantau tabel karyawan sebelum membagi ke departemen

Memahami Data Engineering

Penjadwalan manual, berbasis waktu, dan sensor

  • Manual
  • Otomatis pada waktu tertentu
  • Otomatis saat kondisi tertentu terpenuhi
    • Penjadwalan sensor
  • Perbarui tabel karyawan secara manual
  • Perbarui tabel karyawan pukul 6 pagi
  • Perbarui tabel departemen saat ada karyawan baru
Memahami Data Engineering

Batch dan stream

  • Batch
    • Mengelompokkan catatan per interval
    • Sering lebih murah
  • Stream
    • Mengirim catatan satu per satu segera
  • Lagu yang diunggah artis
  • Tabel karyawan
  • Tabel pendapatan
  • Pengguna baru masuk
  • Contoh lain: mendengarkan online vs. offline
Memahami Data Engineering

Alat penjadwalan

logo Airflow dan Luigi

Memahami Data Engineering

Ringkasan

  • Apa itu penjadwalan
  • Cara menyiapkannya
  • Perbedaan batch vs. stream
  • Implementasi penjadwalan di Spotflix
  • Airflow, Luigi
Memahami Data Engineering

Ayo berlatih!

Memahami Data Engineering

Preparing Video For Download...