Wat staat er in de database?

Exploratory Data Analysis in SQL

Christina Maimone

Data Scientist

PostgreSQL

PostgreSQL-logo

Exploratory Data Analysis in SQL

Databaseclient

Databaseclient maakt verbinding met databaseserver

Exploratory Data Analysis in SQL

entiteit-relatiediagram met elke databasetabel en hun kolommen

Exploratory Data Analysis in SQL

Evanston 311-databasetabel

Exploratory Data Analysis in SQL

erdiagram_fortune500.png

Exploratory Data Analysis in SQL

Tabel in de Stack Overflow-database

Exploratory Data Analysis in SQL

Tabellen die de Stack Overflow-database ondersteunen

Exploratory Data Analysis in SQL

Selecteer een paar rijen

SELECT * 
  FROM company 
LIMIT 5;
 id | exchange | ticker |         name          | parent_id 
<hr />-+----------+--------+-----------------------+-----------
  1 | nasdaq   | PYPL   | PayPal Holdings, Inc. |          
  2 | nasdaq   | AMZN   | Amazon.com, Inc.      |          
  3 | nasdaq   | MSFT   | Microsoft Corporation |          
  4 | nasdaq   | MDB    | MongoDB Inc.          |          
  5 | nasdaq   | DBX    | Dropbox, Inc.         |          
(5 rijen)
Exploratory Data Analysis in SQL

Enkele reminders

Code Opmerking
NULL ontbrekend
Exploratory Data Analysis in SQL

Enkele reminders

Code Opmerking
NULL ontbrekend
IS NULL, IS NOT NULL gebruik geen = NULL
Exploratory Data Analysis in SQL

Enkele reminders

Code Opmerking
NULL ontbrekend
IS NULL, IS NOT NULL gebruik geen = NULL
count(*) aantal rijen
Exploratory Data Analysis in SQL

Enkele reminders

Code Opmerking
NULL ontbrekend
IS NULL, IS NOT NULL gebruik geen = NULL
count(*) aantal rijen
count(column_name) aantal niet-NULL waarden
Exploratory Data Analysis in SQL

Enkele reminders

Code Opmerking
NULL ontbrekend
IS NULL, IS NOT NULL gebruik geen = NULL
count(*) aantal rijen
count(column_name) aantal niet-NULL waarden
count(DISTINCT column_name) aantal verschillende niet-NULL waarden
Exploratory Data Analysis in SQL

Enkele reminders

Code Opmerking
NULL ontbrekend
IS NULL, IS NOT NULL gebruik geen = NULL
count(*) aantal rijen
count(column_name) aantal niet-NULL waarden
count(DISTINCT column_name) aantal verschillende niet-NULL waarden
SELECT DISTINCT column_name ... unieke waarden, incl. NULL
Exploratory Data Analysis in SQL

Laten we beginnen met verkennen

Exploratory Data Analysis in SQL

Preparing Video For Download...