Introduction à Apache Airflow en Python
Mike Metzger
Data Engineer
L’ingénierie des données, c’est :
Un workflow, c’est :

Airflow est une plateforme pour programmer des workflows, incluant :


Autres outils :



Un DAG signifie Directed Acyclic Graph (graphe orienté acyclique)

Définition simple d’un DAG :
etl_dag = DAG(
dag_id='etl_pipeline',
default_args={"start_date": "2024-01-08"}
)
Exécuter une tâche Airflow simple
airflow tasks test <dag_id> <task_id> [execution_date]
Avec un DAG nommé example-etl, une tâche download-file le 2024-01-10 :
airflow tasks test example-etl download-file 2024-01-10
Introduction à Apache Airflow en Python