Une étude des fonctions utiles

Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Michel Semaan

Data Scientist

Attention, valeurs nulles en approche !

Requête

SELECT
  Country, Medal, COUNT(*) AS Awards
FROM summer_medals
WHERE
  Year = 2008 AND Country IN ('CHN', 'RUS')
GROUP BY ROLLUP(Country, Medal)
ORDER BY Country ASC, Medal ASC;
  • null représente les totaux du groupe

Résultat

| Country | Medal  | Awards |
|---------|--------|--------|
| CHN     | Bronze | 57     |
| CHN     | Gold   | 74     |
| CHN     | Silver | 53     |
| CHN     | null   | 184    |
| RUS     | Bronze | 56     |
| RUS     | Gold   | 43     |
| RUS     | Silver | 44     |
| RUS     | null   | 143    |
| null    | null   | 327    |
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

COALESCE

  • COALESCE() prend une liste de valeurs et renvoie la première valeur non null, en procédant de gauche à droite
  • COALESCE(null, null, 1, null, 2) → 1
  • Utile lors de l'utilisation d'opérations SQL qui renvoient des objets de type null
    • ROLLUP et CUBE
    • Pivotement
    • LAG et LEAD
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Suppression des valeurs nulles

Requête

SELECT
  COALESCE(Country, 'Both countries') AS Country,
  COALESCE(Medal, 'All medals') AS Medal,
  COUNT(*) AS Awards
FROM summer_medals
WHERE
  Year = 2008 AND Country IN ('CHN', 'RUS')
GROUP BY ROLLUP(Country, Medal)
ORDER BY Country ASC, Medal ASC;

Résultat

| Country        | Medal      | Awards |
|----------------|------------|--------|
| Both countries | All medals | 327    |
| CHN            | All medals | 184    |
| CHN            | Bronze     | 57     |
| CHN            | Gold       | 74     |
| CHN            | Silver     | 53     |
| RUS            | All medals | 143    |
| RUS            | Bronze     | 56     |
| RUS            | Gold       | 43     |
| RUS            | Silver     | 44     |
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Compression des données

Avant

| Country | Rank |
|---------|------|
| CHN     | 1    |
| RUS     | 2    |
| USA     | 3    |
  • Rank est redondant car le classement est implicite

Après

CHN, RUS, USA
  • Concis et fournit toutes les informations nécessaires, car le classement est implicite
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

STRING_AGG

  • STRING_AGG(column, separator) prend toutes les valeurs d'une colonne et les concatène, en insérant un separator entre chaque valeur

STRING_AGG(Letter, ', ') transforme ceci…

| Letter |
|--------|
| A      |
| B      |
| C      |

…en ceci

A, B, C
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Requête et résultat

Avant

WITH Country_Medals AS (
  SELECT
    Country, COUNT(*) AS Medals
  FROM Summer_Medals
  WHERE Year = 2012
    AND Country IN ('CHN', 'RUS', 'USA')
    AND Medal = 'Gold'
    AND Sport = 'Gymnastics'
  GROUP BY Country),

  SELECT
    Country,
    RANK() OVER (ORDER BY Medals DESC) AS Rank
  FROM Country_Medals
  ORDER BY Rank ASC;

Après

WITH Country_Medals AS (...),

  Country_Ranks AS (...)

  SELECT STRING_AGG(Country, ', ')
  FROM Country_Medals;

Résultat

CHN, RUS, USA
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Passons à la pratique !

Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Preparing Video For Download...