Fenster-Partitionen

Datenbearbeitung in SQL

Mona Khalil

Data Scientist, Greenhouse Software

OVER und PARTITION BY

  • Separate Werte für verschiedene Kategorien berechnen
  • Verschiedene Berechnungen in derselben Spalte
AVG(home_goal) OVER(PARTITION BY season)
Datenbearbeitung in SQL

Partitionen in deinen Daten

  • Wie viele Tore wurden in den jeweiligen Spielen geschossen und wie verhält sich das zum Gesamtdurchschnitt?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    AVG(home_goal + away_goal) OVER() AS overall_avg
FROM match;
| date       | goals | overall_avg |
|------------|-------|-------------|
| 2011-12-17 | 3     | 2.73210     |
| 2012-05-01 | 2     | 2.73210     |
| 2012-11-27 | 4     | 2.73210     |
| 2013-04-20 | 1     | 2.73210     |
| 2013-11-09 | 5     | 2.73210     |
Datenbearbeitung in SQL

Partitionen in deinen Daten

  • Wie viele Tore wurden in den jeweiligen Spielen geschossen und wie verhält sich das zum Gesamtdurchschnitt?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    AVG(home_goal + away_goal) OVER(PARTITION BY season) AS season_avg
FROM match;
| date       | goals | season_avg  |
|------------|-------|-------------|
| 2011-12-17 | 3     | 2.71646     |
| 2012-05-01 | 2     | 2.71646     |
| 2012-11-27 | 4     | 2.77270     |
| 2013-04-20 | 1     | 2.77270     |
| 2013-11-09 | 5     | 2.76682     |
Datenbearbeitung in SQL

Partitioniere nach mehreren Spalten

SELECT 
  c.name,
  m.season,
  (home_goal + away_goal) AS goals,
  AVG(home_goal + away_goal) 
      OVER(PARTITION BY m.season, c.name) AS season_ctry_avg
FROM country AS c
LEFT JOIN match AS m 
ON c.id = m.country_id
| name        | season    | goals     | season_ctry_avg |
|-------------|-----------|-----------|-----------------|
| Belgium     | 2011/2012 | 1         | 2.88            |
| Netherlands | 2014/2015 | 1         | 3.08            |
| Belgium     | 2011/2012 | 1         | 2.88            |
| Spain       | 2014/2015 | 2         | 2.66            |
Datenbearbeitung in SQL

PARTITION BY

  • Kann Daten nach einer oder mehreren Spalten aufteilen
  • Kann Berechnungen, Ranglisten usw. partitionieren
Datenbearbeitung in SQL

Lass uns üben!

Datenbearbeitung in SQL

Preparing Video For Download...