Que contient la base de données ?

Analyse exploratoire des données en SQL

Christina Maimone

Data Scientist

PostgreSQL

Logo PostgreSQL

Analyse exploratoire des données en SQL

Client de base de données

Le client de base de données se connecte au serveur

Analyse exploratoire des données en SQL

diagramme de relations entre entités avec chaque table de la base de données et leurs colonnes

Analyse exploratoire des données en SQL

Table de la base de données Evanston 311

Analyse exploratoire des données en SQL

erdiagram_fortune500.png

Analyse exploratoire des données en SQL

Table de la base de données Stackoverflow

Analyse exploratoire des données en SQL

Tables prenant en charge la table de base de données stackoverflow

Analyse exploratoire des données en SQL

Sélectionnez quelques lignes

SELECT * 
  FROM company 
LIMIT 5;
 id | exchange | ticker |         name          | parent_id 
<hr />-+----------+--------+-----------------------+-----------
  1 | nasdaq   | PYPL   | PayPal Holdings, Inc. |          
  2 | nasdaq   | AMZN   | Amazon.com, Inc.      |          
  3 | nasdaq   | MSFT   | Microsoft Corporation |          
  4 | nasdaq   | MDB    | MongoDB Inc.          |          
  5 | nasdaq   | DBX    | Dropbox, Inc.         |          
(5 rows)
Analyse exploratoire des données en SQL

Quelques rappels

Code Remarque
NULL manquant
Analyse exploratoire des données en SQL

Quelques rappels

Code Remarque
NULL manquant
IS NULL, IS NOT NULL n'utilisez pas = NULL
Analyse exploratoire des données en SQL

Quelques rappels

Code Remarque
NULL manquant
IS NULL, IS NOT NULL n'utilisez pas = NULL
count(*) nombre de lignes
Analyse exploratoire des données en SQL

Quelques rappels

Code Remarque
NULL manquant
IS NULL, IS NOT NULL n'utilisez pas = NULL
count(*) nombre de lignes
count(column_name) nombre de valeurs non-NULLE
Analyse exploratoire des données en SQL

Quelques rappels

Code Remarque
NULL manquant
IS NULL, IS NOT NULL n'utilisez pas = NULL
count(*) nombre de lignes
count(column_name) nombre de valeurs non-NULLE
count(DISTINCT column_name) nombre de valeurs non-NULLE différentes
Analyse exploratoire des données en SQL

Quelques rappels

Code Remarque
NULL manquant
IS NULL, IS NOT NULL n'utilisez pas = NULL
count(*) nombre de lignes
count(column_name) nombre de valeurs non-NULLE
count(DISTINCT column_name) nombre de valeurs non-NULLE différentes
SELECT DISTINCT column_name ... valeurs distinctes, notamment NULL
Analyse exploratoire des données en SQL

Commençons notre exploration

Analyse exploratoire des données en SQL

Preparing Video For Download...