Analyse exploratoire des données en SQL
Christina Maimone
Data Scientist







SELECT *
FROM company
LIMIT 5;
id | exchange | ticker | name | parent_id
<hr />-+----------+--------+-----------------------+-----------
1 | nasdaq | PYPL | PayPal Holdings, Inc. |
2 | nasdaq | AMZN | Amazon.com, Inc. |
3 | nasdaq | MSFT | Microsoft Corporation |
4 | nasdaq | MDB | MongoDB Inc. |
5 | nasdaq | DBX | Dropbox, Inc. |
(5 rows)
| Code | Remarque |
|---|---|
NULL |
manquant |
| Code | Remarque |
|---|---|
NULL |
manquant |
IS NULL, IS NOT NULL |
n'utilisez pas = NULL |
| Code | Remarque |
|---|---|
NULL |
manquant |
IS NULL, IS NOT NULL |
n'utilisez pas = NULL |
count(*) |
nombre de lignes |
| Code | Remarque |
|---|---|
NULL |
manquant |
IS NULL, IS NOT NULL |
n'utilisez pas = NULL |
count(*) |
nombre de lignes |
count(column_name) |
nombre de valeurs non-NULLE |
| Code | Remarque |
|---|---|
NULL |
manquant |
IS NULL, IS NOT NULL |
n'utilisez pas = NULL |
count(*) |
nombre de lignes |
count(column_name) |
nombre de valeurs non-NULLE |
count(DISTINCT column_name) |
nombre de valeurs non-NULLE différentes |
| Code | Remarque |
|---|---|
NULL |
manquant |
IS NULL, IS NOT NULL |
n'utilisez pas = NULL |
count(*) |
nombre de lignes |
count(column_name) |
nombre de valeurs non-NULLE |
count(DISTINCT column_name) |
nombre de valeurs non-NULLE différentes |
SELECT DISTINCT column_name ... |
valeurs distinctes, notamment NULL |
Analyse exploratoire des données en SQL