Bases de datos

Introducción a la ingeniería de datos

Vincent Vankrunkelsven

Data Engineer @ DataCamp

¿Qué son las bases de datos?

 

Imagen de una base de datos

Suele ser un conjunto grande de datos organizado para facilitar la búsqueda y la recuperación rápidas.

 

  • Almacena datos
  • Organiza datos
  • Recupera/Busca datos mediante un SGBD
Introducción a la ingeniería de datos

Bases de datos y almacenamiento de archivos

Bases de datos

 

Imagen de una base de datos

  • Muy organizadas
  • Funciones como búsqueda, replicación, ...

Sistemas de archivos

 

Imagen de archivo

  • Menos organizados
  • Simples, con menos funciones añadidas
Introducción a la ingeniería de datos

Datos estructurados y no estructurados

Estructurados: esquema de base de datos

  • Base de datos relacional

 

Semiestructurados

  • JSON

 

No estructurados: sin esquema, más como archivos

  • Vídeos, fotos

Imagen de una base de datos

 

{ "key": "value"}

 

Imagen de archivo

Introducción a la ingeniería de datos

SQL y NoSQL

SQL

  • Tablas
  • Esquema de base de datos
  • Bases de datos relacionales

 

Imagen de MySQL

Imagen de PostgreSQL

NoSQL

  • Bases de datos no relacionales
  • Estructurados o no estructurados
  • Almacenes clave-valor (p. ej., caché)
  • Base de datos de documentos (p. ej., objetos JSON)

 

Imagen de Redis/MongoDB

Introducción a la ingeniería de datos

SQL: El esquema de la base de datos

-- Create Customer Table 
CREATE TABLE "Customer" (
  "id" SERIAL NOT NULL,
  "first_name" varchar,
  "last_name" varchar,
  PRIMARY KEY ("id")
);

-- Create Order Table 
CREATE TABLE "Order" (
  "id" SERIAL NOT NULL,
  "customer_id" integer REFERENCES "Customer",
  "product_name" varchar,
  "product_price" integer,
  PRIMARY KEY ("id")
);

Esquema de base de datos para Customer y Order

-- Join both tables on foreign key
SELECT * FROM "Customer"
INNER JOIN "Order"
ON "customer_id" = "Customer"."id";
 id | first_name | ... | product_price
  1 | Vincent    | ... |            10
Introducción a la ingeniería de datos

SQL: Esquema en estrella

El esquema en estrella consta de una o más tablas de hechos que hacen referencia a un número cualquiera de tablas de dimensiones.

Diagrama de esquema en estrella de Clientes y Pedidos

  • Hechos: cosas que ocurrieron (p. ej., pedidos de productos)
  • Dimensiones: información del mundo (p. ej., datos de clientes)
1 Wikipedia: https://en.wikipedia.org/wiki/Star_schema
Introducción a la ingeniería de datos

¡Vamos a practicar!

Introducción a la ingeniería de datos

Preparing Video For Download...