Más plantillas

Introducción a Apache Airflow en Python

Mike Metzger

Data Engineer

Recordatorio rápido de tareas

  • Toma una lista de nombres de archivo
  • Imprime "Reading <filename>" en el log/salida
  • Versión con plantilla:
    templated_command="""
    echo "Reading {{ params.filename }}"
    """
    t1 = BashOperator(task_id='template_task',
         bash_command=templated_command,
         params={'filename': 'file1.txt'},
         dag=example_dag)
    
Introducción a Apache Airflow en Python

Plantilla más avanzada

templated_command="""
{% for filename in params.filenames %}

echo "Reading {{ filename }}"
{% endfor %} """
t1 = BashOperator(task_id='template_task', bash_command=templated_command, params={'filenames': ['file1.txt', 'file2.txt']}, dag=example_dag)
Reading file1.txt
Reading file2.txt
Introducción a Apache Airflow en Python

Variables

  • Variables de ejecución integradas de Airflow
  • Aportan info sobre ejecuciones de DAG, tareas e incluso la configuración del sistema.
  • Ejemplos:
Execution Date: {{ ds }}                              # YYYY-MM-DD
Execution Date, no dashes: {{ ds_nodash }}            # YYYYMMDD

Previous Execution date: {{ prev_ds }} # YYYY-MM-DD Prev Execution date, no dashes: {{ prev_ds_nodash }} # YYYYMMDD
DAG object: {{ dag }}
Airflow config object: {{ conf }}
1 https://airflow.apache.org/docs/stable/macros-ref.html
Introducción a Apache Airflow en Python

Macros

Además, existe la variable {{ macros }}.

Hace referencia al paquete de macros de Airflow, que ofrece objetos/métodos útiles para plantillas.

  • {{ macros.datetime }}: el objeto datetime.datetime
  • {{ macros.timedelta }}: el objeto timedelta
  • {{ macros.uuid }}: el objeto uuid de Python
  • {{ macros.ds_add('2020-04-15', 5) }}: Modifica días a una fecha; este ejemplo devuelve 2020-04-20
Introducción a Apache Airflow en Python

¡Vamos a practicar!

Introducción a Apache Airflow en Python

Preparing Video For Download...