ROLLUP

Tomada de decisão orientada por dados em SQL

Bart Baesens

Professor Data Science and Analytics

Tabela renting_extended

As primeiras linhas da tabela renting_extended:

| renting_id | country  | genre  | rating |
|------------|----------|--------|--------|
| 2          | Belgium  | Drama  | 10     |
| 32         | Belgium  | Drama  | 10     |
| 203        | Austria  | Drama  | 6      |
| 292        | Austria  | Comedy | 8      |
| 363        | Belgium  | Drama  | 7      |
| .......... | ........ | ...... | ...... |
Tomada de decisão orientada por dados em SQL

Consulta com ROLLUP

SELECT country, 
       genre, 
       COUNT(*)
FROM renting_extended
GROUP BY ROLLUP (country, genre);
  • Níveis de agregação
    • Agregação de cada combinação de país e gênero
    • Agregação apenas por país
    • Agregação total
Tomada de decisão orientada por dados em SQL

Consulta com ROLLUP

SELECT country, 
       genre, 
       COUNT(*)
FROM renting_extended
GROUP BY ROLLUP (country, genre);
| country | genre  | count |
|---------|--------|-------|
| null    | null   | 22    |
| Austria | Comedy | 2     |
| Belgium | Drama  | 15    |
| Austria | Drama  | 4     |
| Belgium | Comedy | 1     |
| Belgium | null   | 16    |
| Austria | null   | 6     |
Tomada de decisão orientada por dados em SQL

Ordem no ROLLUP

SELECT country, 
       genre, 
       COUNT(*)
FROM renting_extended
GROUP BY ROLLUP (genre, country);
| country | genre  | count |
|---------|--------|-------|
| null    | null   | 22    |
| Austria | Comedy | 2     |
| Belgium | Drama  | 15    |
| Austria | Drama  | 4     |
| Belgium | Comedy | 1     |
| null    | Comedy | 3     |
| null    | Drama  | 19    |
Tomada de decisão orientada por dados em SQL

Resumo do ROLLUP

  • Retorna agregações para uma hierarquia de valores, ex.: ROLLUP (country, genre)
    • Locação por país e por gênero
    • Locação por país
    • Total de locações
  • A cada passo, um nível de detalhe é removido
  • A ordem das colunas é importante no ROLLUP
Tomada de decisão orientada por dados em SQL

Número de locações e avaliações

SELECT country, 
       genre, 
       COUNT(*) AS n_rentals,
       COUNT(rating) AS n_ratings
FROM renting_extended
GROUP BY ROLLUP (genre, country);
| country  | genre  | n_rentals | n_ratings |
|----------|--------|-----------|-----------|
| null     | null   | 22        | 9         |
| Belgium  | Drama  | 15        | 6         |
| Austria  | Comedy | 2         | 1         |
| Belgium  | Comedy | 1         | 0         |
| Austria  | Drama  | 4         | 2         |
| null     | Comedy | 3         | 1         |
| null     | Drama  | 19        | 8         |
Tomada de decisão orientada por dados em SQL

Vamos praticar!

Tomada de decisão orientada por dados em SQL

Preparing Video For Download...