Bases de datos SQL

Comprender la ingeniería de datos

Hadrien Lacroix

Content Developer at DataCamp

SQL

  • Lenguaje de consulta estructurado
  • Norma del sector para el sistema de gestión de bases de datos relacionales (RDBMS)
  • Te permite acceder a muchos registros a la vez, y agruparlos, filtrarlos o agregarlos
  • Cercano al inglés escrito, fácil de escribir y entender
  • Los ingenieros de datos utilizan SQL para crear y mantener bases de datos
  • Los científicos de datos utilizan SQL para consultar (solicitar información a) bases de datos
Comprender la ingeniería de datos

Recuerda la tabla de empleados

index last_name first_name role team full_time office
0 Thien Vivian Data Engineer Data Science 1 Belgium
1 Huong Julian Data Scientist Data Science 1 Belgium
2 Duplantier Norbert Software Developer Infrastructure 1 United Kingdom
3 McColgan Jeff Business Developer Sales 1 United States
4 Sanchez Rick Support Agent Customer Service 0 United States
Comprender la ingeniería de datos

SQL para ingenieros de datos

  • Los ingenieros de datos utilizan SQL para crear, mantener y actualizar tablas.
CREATE TABLE employees (

employee_id INT,
first_name VARCHAR(255),
last_name VARCHAR(255),
role VARCHAR(255),
team VARCHAR(255),
full_time BOOLEAN,
office VARCHAR(255)
);
Comprender la ingeniería de datos

SQL para científicos de datos

  • Los científicos de datos utilizan SQL para consultar, filtrar, agrupar y agregar datos en tablas.
SELECT first_name, last_name

FROM employees
WHERE role LIKE '%Data%'
Comprender la ingeniería de datos

Esquema de la base de datos

  • Las bases de datos están formadas por tablas
  • El esquema de la base de datos rige cómo se relacionan las tablas
Comprender la ingeniería de datos

tabla de álbumes

Comprender la ingeniería de datos

tabla de artistas

Comprender la ingeniería de datos

la tabla artistas está conectada a la tabla álbumes mediante la clave única artist_id

Comprender la ingeniería de datos

tabla de canciones

Comprender la ingeniería de datos

la tabla álbumes está conectada a la tabla canciones mediante la clave única álbum

Comprender la ingeniería de datos

tabla de listas de reproducción

Comprender la ingeniería de datos

la tabla de listas de reproducción está conectada a la tabla de canciones mediante la clave única de canción

Comprender la ingeniería de datos

Varias implementaciones

  • SQLite
  • MySQL
  • PostgreSQL
  • Oracle SQL
  • SQL Server
Comprender la ingeniería de datos

Resumen

  • SQL = estándar del sector
  • Explica cómo los ingenieros de datos y los científicos de datos lo utilizan de forma diferente
  • Esquema de la base de datos
  • Implementaciones SQL
Comprender la ingeniería de datos

¡Vamos a practicar!

Comprender la ingeniería de datos

Preparing Video For Download...