Gleitende Durchschnitte und laufende Summen

PostgreSQL: Zusammenfassende Statistiken und Fensterfunktionen

Michel Semaan

Moving averages

Überblick

  • Gleitender Durchschnitt (MA): Durchschnitt der letzten n Perioden
    • Beispiel: Der gleitende 10-Tages-Durchschnitt der verkauften Einheiten ist der Durchschnitt der in den vergangenen 10 Tagen jeweils verkauften Einheiten
    • Wird eingesetzt, um Dynamik/Trends anzuzeigen
    • Auch hilfreich, um saisonale Schwankungen zu glätten
  • Laufende Summe: Summe der letzten n Perioden
    • Beispiel: Gesamtzahl der Medaillen der letzten drei Olympischen Spiele
    • Zeigt die Leistung an; wenn die Summe sinkt, geht die Gesamtleistung runter
PostgreSQL: Zusammenfassende Statistiken und Fensterfunktionen

Quelltabelle

Abfrage

SELECT
  Year, COUNT(*) AS Medals
FROM Summer_Medals
WHERE
  Country = 'USA'
  AND Medal = 'Gold'
  AND Year >= 1980
GROUP BY Year
ORDER BY Year ASC;

Ergebnis

| Year | Medals |
|------|--------|
| 1984 | 168    |
| 1988 | 77     |
| 1992 | 89     |
| 1996 | 160    |
| 2000 | 130    |
| 2004 | 116    |
| 2008 | 125    |
| 2012 | 147    |
PostgreSQL: Zusammenfassende Statistiken und Fensterfunktionen

Gleitender Durchschnitt

Abfrage

WITH US_Medals AS (...)

SELECT
  Year, Medals,
  AVG(Medals) OVER
    (ORDER BY Year ASC
     ROWS BETWEEN
     2 PRECEDING AND CURRENT ROW) AS Medals_MA
FROM US_Medals
ORDER BY Year ASC;

Ergebnis

| Year | Medals | Medals_MA |
|------|--------|-----------|
| 1984 | 168    | 168.00    |
| 1988 | 77     | 122.50    |
| 1992 | 89     | 111.33    |
| 1996 | 160    | 108.67    |
| 2000 | 130    | 126.33    |
| 2004 | 116    | 135.33    |
| 2008 | 125    | 123.67    |
| 2012 | 147    | 129.33    |
PostgreSQL: Zusammenfassende Statistiken und Fensterfunktionen

Laufende Summe

Abfrage

WITH US_Medals AS (...)

SELECT
  Year, Medals,
  SUM(Medals) OVER
    (ORDER BY Year ASC
     ROWS BETWEEN
     2 PRECEDING AND CURRENT ROW) AS Medals_MT
FROM US_Medals
ORDER BY Year ASC;

Ergebnis

| Year | Medals | Medals_MT |
|------|--------|-----------|
| 1984 | 168    | 168       |
| 1988 | 77     | 245       |
| 1992 | 89     | 334       |
| 1996 | 160    | 326       |
| 2000 | 130    | 379       |
| 2004 | 116    | 406       |
| 2008 | 125    | 371       |
| 2012 | 147    | 388       |
PostgreSQL: Zusammenfassende Statistiken und Fensterfunktionen

ROWS und RANGE im Vergleich

  • RANGE BETWEEN [START] AND [FINISH]
    • Funktioniert fast wie ROWS BETWEEN
    • RANGE behandelt Duplikate in der Unterklausel ORDER BY von OVER als eine Einheit

Tabelle

| Year | Medals | Rows_RT | Range_RT |
|------|--------|---------|----------|
| 1992 | 10     | 10      | 10       |
| 1996 | 50     | 60      | 110      |
| 2000 | 50     | 110     | 110      |
| 2004 | 60     | 170     | 230      |
| 2008 | 60     | 230     | 230      |
| 2012 | 70     | 300     | 300      |
  • ROWS BETWEEN wird fast immer gegenüber RANGE BETWEEN bevorzugt
PostgreSQL: Zusammenfassende Statistiken und Fensterfunktionen

Lass uns üben!

PostgreSQL: Zusammenfassende Statistiken und Fensterfunktionen

Preparing Video For Download...