Bancos de dados SQL

Introdução à Engenharia de Dados

Hadrien Lacroix

Content Developer at DataCamp

SQL

  • Structured Query Language
  • Padrão do setor para sistemas de gerenciamento de bancos de dados relacionais (RDBMS)
  • Permite que você acesse muitos registros de uma só vez e os agrupe, filtre ou agregue
  • Parecido com o inglês escrito, fácil de escrever e entender
  • Os engenheiros de dados usam o SQL para criar e manter bancos de dados
  • Os cientistas de dados usam SQL para consultar (solicitar informações dos) bancos de dados
Introdução à Engenharia de Dados

Recorde a tabela de funcionários

índice sobrenome nome cargo equipe tempo_integral escritório
0 Thien Vivian Engenheira de dados Ciência de dados 1 Bélgica
1 Huong Julian Cientista de dados Ciência de dados 1 Bélgica
2 Duplantier Norbert Desenvolvedor de software Infraestrutura 1 Reino Unido
3 McColgan Jeff Desenvolvedor de negócios Vendas 1 Estados Unidos
4 Sanchez Rick Representante de suporte Atendimento ao cliente 0 Estados Unidos
Introdução à Engenharia de Dados

SQL para engenheiros de dados

  • Os engenheiros de dados usam o SQL para criar, manter e atualizar tabelas.
CREATE TABLE employees (

employee_id INT,
first_name VARCHAR(255),
last_name VARCHAR(255),
role VARCHAR(255),
team VARCHAR(255),
full_time BOOLEAN,
office VARCHAR(255)
);
Introdução à Engenharia de Dados

SQL para cientistas de dados

  • Os cientistas de dados usam o SQL para consultar, filtrar, agrupar e agregar dados em tabelas.
SELECT first_name, last_name

FROM employees
WHERE role LIKE '%Data%'
Introdução à Engenharia de Dados

Esquema do banco de dados

  • Os bancos de dados são feitos de tabelas
  • O esquema do banco de dados determina como as tabelas estão relacionadas
Introdução à Engenharia de Dados

tabela de álbuns

Introdução à Engenharia de Dados

tabela de artistas

Introdução à Engenharia de Dados

A tabela de artistas está ligada à tabela de álbuns por meio da chave exclusiva artist_id

Introdução à Engenharia de Dados

tabela de músicas

Introdução à Engenharia de Dados

A tabela de álbuns está ligada à tabela de músicas por meio da chave exclusiva album

Introdução à Engenharia de Dados

tabela de listas de reprodução

Introdução à Engenharia de Dados

A tabela de listas de reprodução está ligada à tabela de músicas por meio da chave exclusiva song

Introdução à Engenharia de Dados

Várias implementações

  • SQLite
  • MySQL
  • PostgreSQL
  • Oracle SQL
  • SQL Server
Introdução à Engenharia de Dados

Resumo

  • SQL = padrão do setor
  • Explicação de como os engenheiros de dados e os cientistas de dados o utilizam de forma diferente
  • Esquema do banco de dados
  • Implementações do SQL
Introdução à Engenharia de Dados

Vamos praticar!

Introdução à Engenharia de Dados

Preparing Video For Download...