Duplikasi laporan

Pelaporan dengan SQL

Tyler Pernes

Learning & Development Consultant

Apa penyebab duplikasi?

Pelaporan dengan SQL

Apa penyebab duplikasi?

SELECT p.id, SUM(points) AS points, SUM(matches_win) AS matches_won
FROM points AS p
JOIN matches AS m ON p.id = m.id
GROUP BY p.id;
Pelaporan dengan SQL

Apa penyebab duplikasi?

+-----+--------+--------------+
| id  | points | matches_won  |
|-----|--------|--------------|
| 1   | 156    | 10           |
+-----+--------+--------------+
1 akan menghasilkan nilai points tiga kali lipat dari seharusnya, yaitu 156.
Pelaporan dengan SQL

Apa penyebab duplikasi?

Tabel Perantara
+-----+------+--------------+---------+ 
| id  | year | matches_won  | points  |
|-----|------|--------------|---------|    
| 1   | 2016 | 5            | 52      |
| 1   | 2017 | 2            | 52      |  
| 1   | 2018 | 3            | 52      |
+-----+------+--------------+---------+
Pelaporan dengan SQL

Apa penyebab duplikasi?

Tabel Perantara
+-----+------+--------------+---------+ 
| id  | year | matches_won  | points  |
|-----|------|--------------|---------|    
| 1   | 2016 | 5            | 52      | <--
| 1   | 2017 | 2            | 52      | <-- SUM(points) = 52 x 3 = 156
| 1   | 2018 | 3            | 52      | <-- 
+-----+------+--------------+---------+    
Pelaporan dengan SQL

Cara mengatasi duplikasi

1. Hapus agregasi

SELECT p.id, points, SUM(matches_won) AS matches_won
FROM points AS p
JOIN matches AS m ON p.id = m.id
GROUP BY p.id, points;
+-----+--------+--------------+
| id  | points | matches_won  |
|-----|--------|--------------|
| 1   | 52     | 10           |
+-----+--------+--------------+
Pelaporan dengan SQL

Cara mengatasi duplikasi

Pelaporan dengan SQL

Cara mengatasi duplikasi

2. Tambahkan field pada JOIN

SELECT p.id, SUM(points) AS points, SUM(matches_win) AS matches_won
FROM points AS p
JOIN matches AS m ON p.id = m.id AND p.year = m.year
GROUP BY p.id;
Pelaporan dengan SQL

Cara mengatasi duplikasi

2. Tambahkan field pada JOIN

SELECT p.id, SUM(points) AS points, SUM(matches_win) AS matches_won
FROM points AS p
JOIN matches AS m ON p.id = m.id AND p.year = m.year
GROUP BY p.id;
Pelaporan dengan SQL

Cara mengatasi duplikasi

SELECT id, SUM(matches_won)
FROM matches
GROUP BY id;
+-----+--------------+
| id  | matches_won  |
|-----|--------------|
| 1   | 10           |
| 2   | 7            |
+-----+--------------+
Pelaporan dengan SQL

Cara mengatasi duplikasi

3. Ringkas dengan subquery

SELECT p.id, points, matches_won
FROM points AS p
JOIN 
    (SELECT id, SUM(matches_won) AS matches_won
    FROM matches
    GROUP BY id) AS m 
ON p.id = m.id;
Pelaporan dengan SQL

Cara mengatasi duplikasi

  1. Hapus agregasi
  2. Tambahkan field pada JOIN
  3. Ringkas dengan subquery
Pelaporan dengan SQL

Mengidentifikasi duplikasi

Nilai di tabel asli:

SELECT SUM(points) AS total_points
FROM points;
total_points = 52

Nilai di query:

SELECT SUM(points) AS total_points
FROM   
    (SELECT p.id, SUM(points) AS points
    FROM points AS p
    JOIN matches AS m ON p.id = m.id
    GROUP BY p.id) AS subquery;
total_points = 156
Pelaporan dengan SQL

Tujuan bab

Pelaporan dengan SQL

Ayo berlatih!

Pelaporan dengan SQL

Preparing Video For Download...