Introductie tot Apache Airflow in Python
Mike Metzger
Data Engineer
Data engineering is:
Een workflow is:

Airflow is een platform om workflows te programmeren, waaronder:


Andere tools:



Een DAG staat voor Directed Acyclic Graph

Eenvoudige DAG-definitie:
etl_dag = DAG(
dag_id='etl_pipeline',
default_args={"start_date": "2024-01-08"}
)
Een eenvoudige Airflow-taak uitvoeren
airflow tasks test <dag_id> <task_id> [execution_date]
Met een DAG example-etl, een taak download-file op 2024-01-10:
airflow tasks test example-etl download-file 2024-01-10
Introductie tot Apache Airflow in Python