ROLLUP

Prise de décision basée sur des données en SQL

Bart Baesens

Professor Data Science and Analytics

Table renting_extended

Les premières lignes de la table renting_extended :

| renting_id | country  | genre  | rating |
|------------|----------|--------|--------|
| 2          | Belgium  | Drama  | 10     |
| 32         | Belgium  | Drama  | 10     |
| 203        | Austria  | Drama  | 6      |
| 292        | Austria  | Comedy | 8      |
| 363        | Belgium  | Drama  | 7      |
| .......... | ........ | ...... | ...... |
Prise de décision basée sur des données en SQL

Requête avec ROLLUP

SELECT country, 
       genre, 
       COUNT(*)
FROM renting_extended
GROUP BY ROLLUP (country, genre);
  • Niveaux d'agrégation
    • Agrégation de chaque combinaison de pays et de genre
    • Agrégation par pays uniquement
    • Agrégation totale
Prise de décision basée sur des données en SQL

Requête avec ROLLUP

SELECT country, 
       genre, 
       COUNT(*)
FROM renting_extended
GROUP BY ROLLUP (country, genre);
| country | genre  | count |
|---------|--------|-------|
| null    | null   | 22    |
| Austria | Comedy | 2     |
| Belgium | Drama  | 15    |
| Austria | Drama  | 4     |
| Belgium | Comedy | 1     |
| Belgium | null   | 16    |
| Austria | null   | 6     |
Prise de décision basée sur des données en SQL

Classer dans ROLLUP

SELECT country, 
       genre, 
       COUNT(*)
FROM renting_extended
GROUP BY ROLLUP (genre, country);
| country | genre  | count |
|---------|--------|-------|
| null    | null   | 22    |
| Austria | Comedy | 2     |
| Belgium | Drama  | 15    |
| Austria | Drama  | 4     |
| Belgium | Comedy | 1     |
| null    | Comedy | 3     |
| null    | Drama  | 19    |
Prise de décision basée sur des données en SQL

Récapitulatif ROLLUP

  • Renvoie des agrégats pour une hiérarchie de valeurs, par exemple : ROLLUP (country, genre)
    • Locations de films par pays et par genre
    • Locations de films par pays
    • Nombre total de locations de films
  • À chaque étape, un niveau de détail est supprimé
  • L'ordre des noms de colonnes est important pour ROLLUP
Prise de décision basée sur des données en SQL

Nombre de locations et d’évaluations

SELECT country, 
       genre, 
       COUNT(*) AS n_rentals,
       COUNT(rating) AS n_ratings
FROM renting_extended
GROUP BY ROLLUP (genre, country);
| country  | genre  | n_rentals | n_ratings |
|----------|--------|-----------|-----------|
| null     | null   | 22        | 9         |
| Belgium  | Drama  | 15        | 6         |
| Austria  | Comedy | 2         | 1         |
| Belgium  | Comedy | 1         | 0         |
| Austria  | Drama  | 4         | 2         |
| null     | Comedy | 3         | 1         |
| null     | Drama  | 19        | 8         |
Prise de décision basée sur des données en SQL

Passons à la pratique !

Prise de décision basée sur des données en SQL

Preparing Video For Download...