Einführung in Apache Airflow mit Python
Mike Metzger
Data Engineer
Data Engineering ist:
Ein Workflow ist:

Airflow ist eine Plattform zum Programmieren von Workflows, inkl.:


Andere Tools:



Ein DAG ist ein Directed Acyclic Graph

Einfache DAG-Definition:
etl_dag = DAG(
dag_id='etl_pipeline',
default_args={"start_date": "2024-01-08"}
)
Einen einfachen Airflow-Task ausführen
airflow tasks test <dag_id> <task_id> [execution_date]
Mit einem DAG namens example-etl, einem Task download-file am 2024-01-10:
airflow tasks test example-etl download-file 2024-01-10
Einführung in Apache Airflow mit Python