Introductie tot Apache Airflow in Python
Mike Metzger
Data Engineer
schedule_interval te startenrunningfailedsuccess

Bij het plannen van een DAG zijn dit belangrijke attributen:
start_date - Datum/tijd om de eerste run in te plannenend_date - Optioneel: wanneer stoppen met nieuwe runsmax_tries - Optioneel: maximaal aantal pogingenschedule_interval - Hoe vaak uitvoerenschedule_interval betekent:
start_date en end_datecron-syntaxis of via ingebouwde presets
* betekent elke interval (bijv. elke minuut, elke dag)0 12 * * * # Dagelijks om 12:00
* * 25 2 * # Elke minuut op 25 februari
0,15,30,45 * * * * # Elke 15 minuten
Presets:
cron-equivalent:
0 * * * *0 0 * * *0 0 * * 00 0 1 * *0 0 1 1 *Airflow heeft twee speciale schedule_interval-presets:
None - Nooit inplannen; voor handmatig getriggerde DAG's@once - Slechts één keer plannenBij het plannen van een DAG doet Airflow het volgende:
start_date als vroegste momentstart_date + schedule_interval'start_date': datetime(2020, 2, 25),
'schedule_interval': @daily
Dit betekent dat de vroegste starttijd 26 februari 2020 is
Introductie tot Apache Airflow in Python