Window-functies

Gegevens manipuleren in SQL

Mona Khalil

Data Scientist, Greenhouse Software

Werken met aggregatiewaarden

  • Vereist dat je GROUP BY gebruikt met alle niet-aggregatie kolommen
SELECT
  country_id,
  season,
  date,
  AVG(home_goal) AS avg_home
FROM match
GROUP BY country_id;
ERROR: column "match.season" must appear in the GROUP BY 
clause or be used in an aggregate function
Gegevens manipuleren in SQL

Introductie van window-functies!

  • Voer berekeningen uit op een al gegenereerde resultaatset (een window)
  • Aggregatieberekeningen
    • Vergelijkbaar met subqueries in SELECT
    • Lopende totalen, rangschikkingen, voortschrijdende gemiddelden
Gegevens manipuleren in SQL

Wat is een window-functie?

  • Hoeveel doelpunten werden er gescoord in elke wedstrijd in 2011/2012, en hoe verhoudt dat zich tot het gemiddelde?
SELECT
  date,
  (home_goal + away_goal) AS goals,
  (SELECT AVG(home_goal + away_goal) 
     FROM match
     WHERE season = '2011/2012') AS overall_avg
FROM match
WHERE season = '2011/2012';
| date       | goals | overall_avg       |
|------------|-------|-------------------|
| 2011-07-29 | 3     | 2.71646           |
| 2011-07-30 | 2     | 2.71646           |
| 2011-07-30 | 4     | 2.71646           |
| 2011-07-30 | 1     | 2.71646           |
Gegevens manipuleren in SQL

Wat is een window-functie?

  • Hoeveel doelpunten werden er gescoord in elke wedstrijd in 2011/2012, en hoe verhoudt dat zich tot het gemiddelde?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    AVG(home_goal + away_goal) OVER() AS overall_avg
FROM match
WHERE season = '2011/2012';
| date       | goals | overall_avg       |
|------------|-------|-------------------|
| 2011-07-29 | 3     | 2.71646           |
| 2011-07-30 | 2     | 2.71646           |
| 2011-07-30 | 4     | 2.71646           |
| 2011-07-30 | 1     | 2.71646           |
Gegevens manipuleren in SQL

Genereer een RANK

  • Wat is de rang van wedstrijden op basis van het aantal gescoorde doelpunten?
SELECT
    date,
    (home_goal + away_goal) AS goals
FROM match
WHERE season = '2011/2012';
| date       | goals |
|------------|-------|
| 2011-07-29 | 3     |
| 2011-07-30 | 2     |
| 2011-07-30 | 4     |
| 2011-07-30 | 1     |
Gegevens manipuleren in SQL

Genereer een RANK

  • Wat is de rang van wedstrijden op basis van het aantal gescoorde doelpunten?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    RANK() OVER(ORDER BY home_goal + away_goal) AS goals_rank
FROM match
WHERE season = '2011/2012';
| date       | goals | goals_rank |
|------------|-------|------------|
| 2012-04-28 | 0     | 1          |
| 2011-12-26 | 0     | 1          |
| 2011-09-10 | 0     | 1          |
| 2011-08-27 | 0     | 1          |
| 2012-01-07 | 0     | 1          |
Gegevens manipuleren in SQL

Genereer een RANK

  • Wat is de rang van wedstrijden op basis van het aantal gescoorde doelpunten?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    RANK() OVER(ORDER BY home_goal + away_goal DESC) AS goals_rank
FROM match
WHERE season = '2011/2012';
| date       | goals | goals_rank |
|------------|-------|------------|
| 2011-11-06 | 10    | 1          |
| 2011-08-28 | 10    | 1          |
| 2012-05-12 | 9     | 3          |
| 2012-02-12 | 9     | 3          |
| 2012-03-09 | 9     | 3          |
Gegevens manipuleren in SQL

Belangrijke verschillen

  • Verwerkt _na_ elk deel van de query behalve ORDER BY
    • Gebruikt informatie uit de resultaatset in plaats van de database
  • Beschikbaar in PostgreSQL, Oracle, MySQL, SQL Server...
    • ...maar NIET in SQLite
Gegevens manipuleren in SQL

Laten we oefenen!

Gegevens manipuleren in SQL

Preparing Video For Download...