Paralel hesaplama çerçeveleri

Data Engineering'e Giriş

Vincent Vankrunkelsven

Data Engineer @ DataCamp

Apache Hadoop logosu

HDFS

Dağıtık dosya sistemi olarak HDFS diyagramı

Hadoop MapReduce logosu

Olimpik etkinlikler örneğini gösteren diyagram

Apache Hive logosu

SELECT year, AVG(age)
FROM views.athlete_events
GROUP BY year

Hive'dan MapReduce'a diyagram

Spark logosu görseli

# Load the dataset into athlete_events_spark first

(athlete_events_spark
  .groupBy('Year')
  .mean('Age')
  .show())

SELECT year, AVG(age)
FROM views.athlete_events
GROUP BY year

Data Engineering'e Giriş