Introduction à Apache Airflow en Python
Mike Metzger
Data Engineer
schedule_intervalrunningfailedsuccess

Lors de la planification d’un DAG, notez :
start_date - Date/heure du premier déclenchement du DAGend_date - Optionnel, quand arrêter de créer de nouvelles instancesmax_tries - Optionnel, nombre de tentativesschedule_interval - Fréquence d’exécutionschedule_interval indique :
start_date et end_datecron ou des préréglages intégrés
* signifie à chaque intervalle (ex. chaque minute, chaque jour)0 12 * * * # Exécuter chaque jour à midi
* * 25 2 * # Exécuter chaque minute le 25 février
0,15,30,45 * * * * # Exécuter toutes les 15 minutes
Préréglages :
Équivalent cron :
0 * * * *0 0 * * *0 0 * * 00 0 1 * *0 0 1 1 *Airflow propose deux préréglages spéciaux pour schedule_interval :
None - Aucune planification, pour les DAG déclenchés manuellement@once - Planifier une seule foisLors de la planification d’un DAG, Airflow :
start_date comme date la plus précocestart_date + schedule_interval'start_date': datetime(2020, 2, 25),
'schedule_interval': @daily
Donc l’heure de début la plus tôt pour exécuter le DAG est le 26 février 2020
Introduction à Apache Airflow en Python