Waar zijn de subqueries?

Gegevens manipuleren in SQL

Mona Khalil

Data Scientist, Greenhouse Software

Wat is een subquery?

  • Een query genest in een andere query
SELECT column
FROM (SELECT column
      FROM table) AS subquery;
  • Handig voor tussentijdse transformaties
Gegevens manipuleren in SQL

Wat doe je met subqueries?

  • Kan in elk deel van een query staan

    • SELECT, FROM, WHERE, GROUP BY
  • Kan verschillende informatie teruggeven

    • Scalaire waarden (3.14159, -2, 0.001)
    • Een lijst (id = (12, 25, 392, 401, 939))
    • Een tabel
Gegevens manipuleren in SQL

Waarom subqueries?

  • Groepen vergelijken met samengevatte waarden
    • Hoe verhoudt Liverpool zich tot het gemiddelde van de Engelse Premier League dat jaar?
  • Data herstructureren
    • Wat is het hoogste maandelijkse gemiddelde van gescoorde doelpunten in de Bundesliga?
  • Data combineren die niet te koppelen zijn
    • Hoe krijg je zowel de thuis- als uitteamnamen in een tabel met wedstrijdresultaten?
Gegevens manipuleren in SQL

Eenvoudige subqueries

  • Kan onafhankelijk van de buitenste query worden geëvalueerd
SELECT home_goal
FROM match
WHERE home_goal > (
    SELECT AVG(home_goal) 
    FROM match);

SELECT AVG(home_goal) FROM match;
1.56091291478423
Gegevens manipuleren in SQL

Eenvoudige subqueries

  • Wordt slechts één keer verwerkt in de hele instructie
SELECT home_goal
FROM match
WHERE home_goal > (
    SELECT AVG(home_goal) 
    FROM match);
Gegevens manipuleren in SQL

Subqueries in de WHERE-clausule

  • Welke wedstrijden in het seizoen 2012/2013 scoorden thuisdoelpunten boven het gemiddelde?
SELECT AVG(home_goal) FROM match;
1.56091291478423
SELECT date, hometeam_id, awayteam_id, home_goal, away_goal
FROM match
WHERE season = '2012/2013'
      AND home_goal > 1.56091291478423;
Gegevens manipuleren in SQL

Subqueries in de WHERE-clausule

  • Welke wedstrijden in het seizoen 2012/2013 scoorden thuisdoelpunten boven het gemiddelde?
SELECT date, hometeam_id, awayteam_id, home_goal, away_goal
FROM match
WHERE season = '2012/2013'
      AND home_goal > (SELECT AVG(home_goal)
                     FROM match);
| date       | hometeam_id | awayteam_id | home_goal | away_goal |
|------------|-------------|-------------|-----------|-----------|
| 2012-07-28 | 9998        | 1773        | 5         | 2         |
| 2012-07-29 | 9987        | 9984        | 3         | 3         |
| 2012-10-05 | 9993        | 9991        | 2         | 2         |
Gegevens manipuleren in SQL

Subquery filteren met IN

  • Welke teams zijn onderdeel van de Poolse competitie?
SELECT
  team_long_name,
  team_short_name AS abbr
FROM team
WHERE 
  team_api_id IN 
  (SELECT hometeam_id
   FROM match
   WHERE country_id = 15722);
| team_long_name | abbr |
|----------------|------|
| Ruch Chorzów   | CHO  |
| Jagiellonia    | BIA  |
| Lech Poznań    | POZ  |
| P. Warszawa    | PWA  |
| Cracovia       | CKR  |
| Górnik Łęczna  | LEC  |
| Polonia Bytom  | GOR  |
| Zagłębie Lubin | ZAG  |
| Pogoń Szczecin | POG  |
| Widzew Łódź    | WID  |
| Śląsk Wrocław  | SLA  |
Gegevens manipuleren in SQL

Laten we oefenen!

Gegevens manipuleren in SQL

Preparing Video For Download...