Introducción a Apache Airflow en Python
Mike Metzger
Data Engineer
La ingeniería de datos es:
Un flujo de trabajo es:

Airflow es una plataforma para programar flujos de trabajo, incluyendo:


Otras herramientas:



Un DAG es un grafo acíclico dirigido.

Definición simple de DAG:
etl_dag = DAG(
dag_id='etl_pipeline',
default_args={"start_date": "2024-01-08"}
)
Ejecutar una tarea simple de Airflow
airflow tasks test <dag_id> <task_id> [execution_date]
Usando un DAG llamado example-etl, una tarea download-file el 2024-01-10:
airflow tasks test example-etl download-file 2024-01-10
Introducción a Apache Airflow en Python