Menjadwalkan data

Memahami Rekayasa Data

Hadrien Lacroix

Content Developer at DataCamp

Penjadwalan

  • Dapat diterapkan pada tugas apa pun dalam pemrosesan data
  • Penjadwalan adalah perekat sistem Anda
  • Menyatukan komponen dan mengatur cara kerjanya
  • Menjalankan tugas berurutan dan menyelesaikan dependensi
Memahami Rekayasa Data

Penjadwalan manual, berbasis waktu, dan sensor

  • Manual
  • Perbarui tabel karyawan secara manual
Memahami Rekayasa Data

pipeline data

Memahami Rekayasa Data

gambar jam — tabel karyawan diperbarui setiap hari pukul 6 pagi

Memahami Rekayasa Data

Penjadwalan manual, berbasis waktu, dan sensor

  • Manual
  • Otomatis pada waktu tertentu
  • Otomatis saat kondisi tertentu terpenuhi
    • Penjadwalan sensor
  • Perbarui tabel karyawan secara manual
  • Perbarui tabel karyawan pukul 6 pagi
Memahami Rekayasa Data

pipeline data

Memahami Rekayasa Data

gambar sensor memantau tabel karyawan sebelum membagi ke departemen

Memahami Rekayasa Data

Penjadwalan manual, berbasis waktu, dan sensor

  • Manual
  • Otomatis pada waktu tertentu
  • Otomatis saat kondisi tertentu terpenuhi
    • Penjadwalan sensor
  • Perbarui tabel karyawan secara manual
  • Perbarui tabel karyawan pukul 6 pagi
  • Perbarui tabel departemen saat ada karyawan baru
Memahami Rekayasa Data

Batch dan stream

  • Batch
    • Mengelompokkan catatan per interval
    • Sering lebih murah
  • Stream
    • Mengirim catatan satu per satu segera
  • Lagu yang diunggah artis
  • Tabel karyawan
  • Tabel pendapatan
  • Pengguna baru masuk
  • Contoh lain: mendengarkan online vs. offline
Memahami Rekayasa Data

Alat penjadwalan

logo Airflow dan Luigi

Memahami Rekayasa Data

Ringkasan

  • Apa itu penjadwalan
  • Cara menyiapkannya
  • Perbedaan batch vs. stream
  • Implementasi penjadwalan di Spotflix
  • Airflow, Luigi
Memahami Rekayasa Data

Ayo berlatih!

Memahami Rekayasa Data

Preparing Video For Download...