Funções de janela

Manipulação de dados em SQL

Mona Khalil

Data Scientist, Greenhouse Software

Trabalhar com valores agregados

  • Exige usar GROUP BY com todas as colunas não agregadas
SELECT
  country_id,
  season,
  date,
  AVG(home_goal) AS avg_home
FROM match
GROUP BY country_id;
ERROR: column "match.season" must appear in the GROUP BY 
clause or be used in an aggregate function
Manipulação de dados em SQL

Apresentando as funções de janela!

  • Realizar cálculos em um conjunto de resultados já gerado (uma janela)
  • Cálculos agregados
    • Similar a subconsultas no SELECT
    • Totais acumulados, classificações, médias móveis
Manipulação de dados em SQL

O que é uma função de janela?

  • Quantos gols foram marcados em cada partida na temporada 2011/2012, e como isso se compara à média?
SELECT
  date,
  (home_goal + away_goal) AS goals,
  (SELECT AVG(home_goal + away_goal) 
     FROM match
     WHERE season = '2011/2012') AS overall_avg
FROM match
WHERE season = '2011/2012';
| date       | goals | overall_avg       |
|------------|-------|-------------------|
| 2011-07-29 | 3     | 2.71646           |
| 2011-07-30 | 2     | 2.71646           |
| 2011-07-30 | 4     | 2.71646           |
| 2011-07-30 | 1     | 2.71646           |
Manipulação de dados em SQL

O que é uma função de janela?

  • Quantos gols foram marcados em cada partida na temporada 2011/2012, e como isso se compara à média?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    AVG(home_goal + away_goal) OVER() AS overall_avg
FROM match
WHERE season = '2011/2012';
| date       | goals | overall_avg       |
|------------|-------|-------------------|
| 2011-07-29 | 3     | 2.71646           |
| 2011-07-30 | 2     | 2.71646           |
| 2011-07-30 | 4     | 2.71646           |
| 2011-07-30 | 1     | 2.71646           |
Manipulação de dados em SQL

Gerar um RANK

  • Qual é a classificação dos jogos com base no número de gols marcados?
SELECT
    date,
    (home_goal + away_goal) AS goals
FROM match
WHERE season = '2011/2012';
| date       | goals |
|------------|-------|
| 2011-07-29 | 3     |
| 2011-07-30 | 2     |
| 2011-07-30 | 4     |
| 2011-07-30 | 1     |
Manipulação de dados em SQL

Gerar um RANK

  • Qual é a classificação dos jogos com base no número de gols marcados?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    RANK() OVER(ORDER BY home_goal + away_goal) AS goals_rank
FROM match
WHERE season = '2011/2012';
| date       | goals | goals_rank |
|------------|-------|------------|
| 2012-04-28 | 0     | 1          |
| 2011-12-26 | 0     | 1          |
| 2011-09-10 | 0     | 1          |
| 2011-08-27 | 0     | 1          |
| 2012-01-07 | 0     | 1          |
Manipulação de dados em SQL

Gerar um RANK

  • Qual é a classificação dos jogos com base no número de gols marcados?
SELECT
    date,
    (home_goal + away_goal) AS goals,
    RANK() OVER(ORDER BY home_goal + away_goal DESC) AS goals_rank
FROM match
WHERE season = '2011/2012';
| date       | goals | goals_rank |
|------------|-------|------------|
| 2011-11-06 | 10    | 1          |
| 2011-08-28 | 10    | 1          |
| 2012-05-12 | 9     | 3          |
| 2012-02-12 | 9     | 3          |
| 2012-03-09 | 9     | 3          |
Manipulação de dados em SQL

Principais diferenças

  • Processado após cada parte da consulta, exceto ORDER BY
    • Usa as informações do resultado em vez do banco de dados
  • Disponível no PostgreSQL, Oracle, MySQL, SQL Server...
    • ...mas NÃO no SQLite
Manipulação de dados em SQL

Vamos praticar!

Manipulação de dados em SQL

Preparing Video For Download...