Introducción a Apache Airflow en Python
Mike Metzger
Data Engineer
schedule_intervalrunningfailedsuccess

Al programar un DAG, destacan estos atributos:
start_date - Fecha/hora inicial para programar la ejecuciónend_date - Opcional; cuándo dejar de crear nuevas instanciasmax_tries - Opcional; número de intentosschedule_interval - Frecuencia de ejecuciónschedule_interval indica:
start_date y end_datecron o con presets integrados
* ejecuta en cada intervalo (p. ej., cada minuto, cada día)0 12 * * * # Run daily at noon
* * 25 2 * # Run once per minute on February 25
0,15,30,45 * * * * # Run every 15 minutes
Presets:
Equivalente cron:
0 * * * *0 0 * * *0 0 * * 00 0 1 * *0 0 1 1 *Airflow tiene dos presets especiales de schedule_interval:
None - No programar nunca; para DAGs lanzados manualmente@once - Programar solo una vezAl programar un DAG, Airflow:
start_date como el valor más tempranostart_date + schedule_interval'start_date': datetime(2020, 2, 25),
'schedule_interval': @daily
Esto significa que la primera ejecución posible del DAG es el 26 de febrero de 2020
Introducción a Apache Airflow en Python