Einführung in das Data Engineering
Vincent Vankrunkelsven
Data Engineer @ DataCamp

Eine üblicherweise große Sammlung von Daten, die speziell für die schnelle Suche und den schnellen Abruf organisiert ist.


Strukturiert: Datenbankschema
Halbstrukturiert
Unstrukturiert: ohne Schema, eher wie Dateien

{ "key": "value"}




-- Create Customer Table
CREATE TABLE "Customer" (
"id" SERIAL NOT NULL,
"first_name" varchar,
"last_name" varchar,
PRIMARY KEY ("id")
);
-- Create Order Table
CREATE TABLE "Order" (
"id" SERIAL NOT NULL,
"customer_id" integer REFERENCES "Customer",
"product_name" varchar,
"product_price" integer,
PRIMARY KEY ("id")
);

-- Join both tables on foreign key
SELECT * FROM "Customer"
INNER JOIN "Order"
ON "customer_id" = "Customer"."id";
id | first_name | ... | product_price
1 | Vincent | ... | 10
Das Sternschema besteht aus einer oder mehreren Faktentabellen, die auf beliebig viele Dimensionstabellen verweisen.

Einführung in das Data Engineering