Einführung in das Data Engineering
Vincent Vankrunkelsven
Data Engineer @ DataCamp



df = spark.read.parquet("users.parquet")
outliers = df.filter(df["age"] > 100)
print(outliers.count())
Dateningenieure verstehen die Abstraktionen.

JoinProductOrder muss nach CleanProduct und CleanOrder laufen
Datenbanken


Verarbeitung

Datenplanung




Einführung in das Data Engineering