Pagination

Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Michel Semaan

Data Scientist

Qu'est-ce que la pagination ?

  • Pagination : diviser les données en segments (approximativement) égaux
  • Utilisations
    • De nombreuses API renvoient les données sous forme de « pages » afin de réduire le volume de données envoyées
    • Séparation des données en quartiles ou en tiers (33 % supérieurs, 33 % intermédiaires et 33 % inférieurs) afin d'évaluer les performances

NTILE

  • NTILE(n) divise les données en n pages approximativement égales
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Pagination - Tableau source

Requête

SELECT
  DISTINCT Discipline
FROM Summer_Medals;
  • Répartissez les données en 15 pages de taille approximativement égale
  • $67 / 15 \simeq 4$, donc chaque page contiendra quatre ou cinq lignes

Résultat

| Discipline          |
|---------------------|
| Wrestling Freestyle |
| Archery             |
| Baseball            |
| Lacrosse            |
| Judo                |
| Athletics           |
| ...                 |

(67 rows)
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Pagination

Requête

WITH Disciplines AS (
  SELECT
    DISTINCT Discipline
  FROM Summer_Medals)

SELECT
  Discipline, NTILE(15) OVER () AS Page
From Disciplines
ORDER BY Page ASC;

Résultat

| Discipline          | Page |
|---------------------|------|
| Wrestling Freestyle | 1    |
| Archery             | 1    |
| Baseball            | 1    |
| Lacrosse            | 1    |
| Judo                | 1    |
| Athletics           | 2    |
| ...                 | ...  |
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Tiers supérieur, central et inférieur

Requête

WITH Country_Medals AS (
  SELECT
    Country, COUNT(*) AS Medals
  FROM Summer_Medals
  GROUP BY Country),

SELECT
  Country, Medals,
  NTILE(3) OVER (ORDER BY Medals DESC) AS Third
FROM Country_Medals;

Résultat

| Country | Medals | Third |
|---------|--------|-------|
| USA     | 4585   | 1     |
| URS     | 2049   | 1     |
| GBR     | 1720   | 1     |
| ...     | ...    | ...   |
| CZE     | 56     | 2     |
| LTU     | 55     | 2     |
| ...     | ...    | ...   |
| DOM     | 6      | 3     |
| BWI     | 5      | 3     |
| ...     | ...    | ...   |
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Moyennes des tiers

Requête

WITH Country_Medals AS (...),

  Thirds AS (
  SELECT
    Country, Medals,
    NTILE(3) OVER (ORDER BY Medals DESC) AS Third
  FROM Country_Medals)

SELECT
  Third,
  ROUND(AVG(Medals), 2) AS Avg_Medals
FROM Thirds
GROUP BY Third
ORDER BY Third ASC;

Résultat

| Third | Avg_Medals |
|-------|------------|
| 1     | 598.74     |
| 2     | 22.98      |
| 3     | 2.08       |
Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Passons à la pratique !

Statistiques récapitulatives et fonctions de fenêtrage PostgreSQL

Preparing Video For Download...