Funzioni Finestra

Manipolazione dei dati in SQL

Mona Khalil

Data Scientist, Greenhouse Software

Lavorare con valori aggregati

  • Richiede l'uso di GROUP BY con tutte le colonne non aggregate
SELECT
  country_id,
  season,
  date,
  AVG(home_goal) AS avg_home
FROM match
GROUP BY country_id;
ERROR: column "match.season" must appear in the GROUP BY 
clause or be used in an aggregate function
Manipolazione dei dati in SQL

Introduzione alle funzioni finestra!

  • Esegui calcoli su un set di risultati già generato (una finestra)
  • Calcoli aggregati
    • Simile alle sottoquery in SELECT
    • Totali parziali, classifiche, medie mobili
Manipolazione dei dati in SQL

Cos'è una funzione finestra?

  • Quanti gol sono stati segnati in ogni partita nel 2011/2012 e come si confrontano con la media?
SELECT
  date,
  (home_goal + away_goal) AS goals,
  (SELECT AVG(home_goal + away_goal) 
     FROM match
     WHERE season = '2011/2012') AS overall_avg
FROM match
WHERE season = '2011/2012';
| date       | goals | overall_avg       |
|------------|-------|-------------------|
| 2011-07-29 | 3     | 2.71646           |
| 2011-07-30 | 2     | 2.71646           |
| 2011-07-30 | 4     | 2.71646           |
| 2011-07-30 | 1     | 2.71646           |
Manipolazione dei dati in SQL

Cos'è una funzione finestra?

  • Quanti gol sono stati segnati in ogni partita nel 2011/2012 e come si confrontano con la media?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    AVG(home_goal + away_goal) OVER() AS overall_avg
FROM match
WHERE season = '2011/2012';
| date       | goals | overall_avg       |
|------------|-------|-------------------|
| 2011-07-29 | 3     | 2.71646           |
| 2011-07-30 | 2     | 2.71646           |
| 2011-07-30 | 4     | 2.71646           |
| 2011-07-30 | 1     | 2.71646           |
Manipolazione dei dati in SQL

Genera un RANK

  • Qual è il rango delle partite in base ai gol segnati?
SELECT
    date,
    (home_goal + away_goal) AS goals
FROM match
WHERE season = '2011/2012';
| date       | goals |
|------------|-------|
| 2011-07-29 | 3     |
| 2011-07-30 | 2     |
| 2011-07-30 | 4     |
| 2011-07-30 | 1     |
Manipolazione dei dati in SQL

Genera un RANK

  • Qual è il rango delle partite in base ai gol segnati?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    RANK() OVER(ORDER BY home_goal + away_goal) AS goals_rank
FROM match
WHERE season = '2011/2012';
| date       | goals | goals_rank |
|------------|-------|------------|
| 2012-04-28 | 0     | 1          |
| 2011-12-26 | 0     | 1          |
| 2011-09-10 | 0     | 1          |
| 2011-08-27 | 0     | 1          |
| 2012-01-07 | 0     | 1          |
Manipolazione dei dati in SQL

Genera un RANK

  • Qual è il rango delle partite in base ai gol segnati?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    RANK() OVER(ORDER BY home_goal + away_goal DESC) AS goals_rank
FROM match
WHERE season = '2011/2012';
| date       | goals | goals_rank |
|------------|-------|------------|
| 2011-11-06 | 10    | 1          |
| 2011-08-28 | 10    | 1          |
| 2012-05-12 | 9     | 3          |
| 2012-02-12 | 9     | 3          |
| 2012-03-09 | 9     | 3          |
Manipolazione dei dati in SQL

Differenze chiave

  • Elaborato dopo ogni parte della query tranne ORDER BY
    • Usa le informazioni nel set di risultati anziché nel database
  • Disponibile in PostgreSQL, Oracle, MySQL, SQL Server...
    • ...ma NON in SQLite
Manipolazione dei dati in SQL

Ayo berlatih!

Manipolazione dei dati in SQL

Preparing Video For Download...