SQL-databases

Data Engineering begrijpen

Hadrien Lacroix

Content Developer at DataCamp

SQL

  • Structured Query Language
  • Industriestandaard voor Relational Database Management Systems (RDBMS)
  • Toegang tot veel records tegelijk; groeperen, filteren en aggregeren
  • Lijkt op geschreven Engels; makkelijk te schrijven en te lezen
  • Data engineers maken en onderhouden databases met SQL
  • Data scientists gebruiken SQL om databases te bevragen
Data Engineering begrijpen

Herinner je de tabel employees

index last_name first_name role team full_time office
0 Thien Vivian Data Engineer Data Science 1 Belgium
1 Huong Julian Data Scientist Data Science 1 Belgium
2 Duplantier Norbert Software Developer Infrastructure 1 United Kingdom
3 McColgan Jeff Business Developer Sales 1 United States
4 Sanchez Rick Support Agent Customer Service 0 United States
Data Engineering begrijpen

SQL voor data engineers

  • Data engineers gebruiken SQL om tabellen te maken, te onderhouden en te updaten.
CREATE TABLE employees (

employee_id INT,
first_name VARCHAR(255),
last_name VARCHAR(255),
role VARCHAR(255),
team VARCHAR(255),
full_time BOOLEAN,
office VARCHAR(255)
);
Data Engineering begrijpen

SQL voor data scientists

  • Data scientists gebruiken SQL om data in tabellen te bevragen, filteren, groeperen en aggregeren.
SELECT first_name, last_name

FROM employees
WHERE role LIKE '%Data%'
Data Engineering begrijpen

Databaseschema

  • Databases bestaan uit tabellen
  • Het databaseschema bepaalt hoe tabellen samenhangen
Data Engineering begrijpen

tabel albums

Data Engineering begrijpen

tabel artists

Data Engineering begrijpen

tabel artists is gekoppeld aan tabel albums via de unieke sleutel artist_id

Data Engineering begrijpen

tabel songs

Data Engineering begrijpen

tabel albums is gekoppeld aan tabel songs via de unieke sleutel album

Data Engineering begrijpen

tabel playlists

Data Engineering begrijpen

tabel playlists is gekoppeld aan tabel songs via de unieke sleutel song

Data Engineering begrijpen

Meerdere implementaties

  • SQLite
  • MySQL
  • PostgreSQL
  • Oracle SQL
  • SQL Server
Data Engineering begrijpen

Samenvatting

  • SQL = industriestandaard
  • Verschil in gebruik door data engineers en data scientists
  • Databaseschema
  • SQL-implementaties
Data Engineering begrijpen

Laten we oefenen!

Data Engineering begrijpen

Preparing Video For Download...