Pengantar Apache Airflow dengan Python
Mike Metzger
Data Engineer
schedule_intervalrunningfailedsuccess

Saat menjadwalkan DAG, atribut penting:
start_date - Tanggal/waktu awal menjadwalkan DAG runend_date - Opsional, kapan berhenti membuat instance DAG barumax_tries - Opsional, jumlah percobaanschedule_interval - Frekuensi jalanschedule_interval menyatakan:
start_date dan end_datecron atau preset bawaan
* berarti berjalan tiap interval (mis. tiap menit, tiap hari)0 12 * * * # Jalan harian pukul 12 siang
* * 25 2 * # Setiap menit pada 25 Februari
0,15,30,45 * * * * # Tiap 15 menit
Preset:
Padanan cron:
0 * * * *0 0 * * *0 0 * * 00 0 1 * *0 0 1 1 *Airflow memiliki dua preset schedule_interval khusus:
None - Tidak pernah menjadwalkan, untuk DAG yang dipicu manual@once - Menjadwalkan hanya sekaliSaat menjadwalkan DAG, Airflow akan:
start_date sebagai nilai paling awalstart_date + schedule_interval'start_date': datetime(2020, 2, 25),
'schedule_interval': @daily
Artinya waktu mulai paling awal untuk menjalankan DAG adalah 26 Februari 2020
Pengantar Apache Airflow dengan Python