Introdução ao Apache Airflow em Python
Mike Metzger
Data Engineer
schedule_intervalrunningfailedsuccess

Ao agendar um DAG, observe:
start_date - Data/hora inicial do agendamentoend_date - Opcional; quando parar novas instânciasmax_tries - Opcional; número de tentativasschedule_interval - Frequência de execuçãoschedule_interval indica:
start_date e end_datecron ou presets nativos
* executa em todo intervalo (ex.: cada minuto, cada dia)0 12 * * * # Executa diariamente ao meio-dia
* * 25 2 * # Executa a cada minuto em 25 de fevereiro
0,15,30,45 * * * * # Executa a cada 15 minutos
Presets:
cron equivalente:
0 * * * *0 0 * * *0 0 * * 00 0 1 * *0 0 1 1 *O Airflow tem dois presets especiais de schedule_interval:
None - Nunca agenda; usado para DAGs manuais@once - Agenda só uma vezAo agendar um DAG, o Airflow vai:
start_date como o menor valorstart_date + schedule_interval'start_date': datetime(2020, 2, 25),
'schedule_interval': @daily
Isso significa que o primeiro horário de execução é 26 de fevereiro de 2020
Introdução ao Apache Airflow em Python