Bases de données SQL

Présentation de l’ingénierie des données

Hadrien Lacroix

Content Developer at DataCamp

SQL

  • Langage structuré de requête
  • Norme industrielle pour les systèmes de gestion de bases de données relationnelles (SGBDR)
  • Vous permet d'accéder à de nombreux enregistrements à la fois et de les regrouper, de les filtrer ou de les agréger
  • Proche de l'anglais écrit, facile à écrire et à comprendre
  • Les ingénieurs de données utilisent le SQL pour créer et maintenir des bases de données
  • Les data scientists utilisent le SQL pour interroger (demander des informations) les bases de données
Présentation de l’ingénierie des données

Rappelez-vous la table des employés

index last_name first_name role team full_time office
0 Thien Vivian Ingénieur de données Data Science 1 Belgique
1 Huong Julian Data Scientist Data Science 1 Belgique
2 Duplantier Norbert Software Developer Infrastructure 1 Royaume-Uni
3 McColgan Jeff Business Developer Sales 1 États-Unis
4 Sanchez Rick Support Agent Customer Service 0 États-Unis
Présentation de l’ingénierie des données

SQL pour les ingénieurs de données

  • Les ingénieurs de données utilisent le SQL pour créer, maintenir et mettre à jour des tables.
CREATE TABLE employees (

employee_id INT,
first_name VARCHAR(255),
last_name VARCHAR(255),
role VARCHAR(255),
team VARCHAR(255),
full_time BOOLEAN,
office VARCHAR(255)
);
Présentation de l’ingénierie des données

SQL pour les data scientists

  • Le data scientist utilise le SQL pour interroger, filtrer, grouper et agréger des données dans des tables.
SELECT first_name, last_name

FROM employees
WHERE role LIKE '%Data%'
Présentation de l’ingénierie des données

Schéma de la base de données

  • Les bases de données sont constituées de tables
  • Le schéma de la base de données régit la manière dont les tables sont reliées entre elles
Présentation de l’ingénierie des données

table des albums

Présentation de l’ingénierie des données

table des artistes

Présentation de l’ingénierie des données

la table artistes est connectée à la table albums par l'intermédiaire de la clé unique artist_id

Présentation de l’ingénierie des données

table des chansons

Présentation de l’ingénierie des données

la table des albums est reliée à la table chansons par l'intermédiaire de la clé unique album

Présentation de l’ingénierie des données

table des listes de lecture

Présentation de l’ingénierie des données

la table des listes de lecture est reliée à la table des chansons par l'intermédiaire de la clé unique de la chanson

Présentation de l’ingénierie des données

Plusieurs mises en œuvre

  • SQLite
  • MySQL
  • PostgreSQL
  • Oracle SQL
  • SQL Server
Présentation de l’ingénierie des données

Résumé

  • SQL = norme industrielle
  • Expliquez comment les ingénieurs et les data scientists l'utilisent différemment
  • Schéma de la base de données
  • Implémentations SQL
Présentation de l’ingénierie des données

Passons à la pratique !

Présentation de l’ingénierie des données

Preparing Video For Download...