Data samenvatten

Gevorderde SQL-query’s met AI

Jasmin Ludolf

Senior Data Science Content Developer

Aggregatiefuncties

$$

  • SUM()
  • AVG()
  • MIN()
  • MAX()

$$

  • Wat is het gemiddelde aantal stemmen per film?

Rapport met samenvattende statistieken

Gevorderde SQL-query’s met AI

Velden samenvatten

$$

  • Aggregatiefuncties vatten meerdere rijen samen tot één waarde

$$

  • Begrijp data als geheel of per groep

Opdracht: Toon het totale aantal stemmen over films

SELECT SUM(num_votes) AS total_votes
FROM reviews;
|total_votes|
|-----------|
|419507814  |
Gevorderde SQL-query’s met AI

Gemiddelden berekenen

Opdracht: Wat is het gemiddelde aantal stemmen per film?

SELECT AVG(num_votes) AS average_votes_per_film
FROM reviews;
|average_votes_per_film|
|----------------------|
|84441.991545893720    |
Gevorderde SQL-query’s met AI

Resultaten afronden

Opdracht: Wat is het afgeronde gemiddelde aantal stemmen per film?

SELECT ROUND(AVG(num_votes)) AS avg_votes
FROM reviews;
|avg_votes|
|---------|
|84442    |
ROUND(AVG(num_votes), 1)
84442.0
ROUND(AVG(num_votes), 2)
84441.99
ROUND(AVG(num_votes), -2)
84400
Gevorderde SQL-query’s met AI

Resultaten afronden

Opdracht: ...afgerond op één decimaal

SELECT ROUND(AVG(num_votes), 1) AS avg_votes
FROM reviews;
|avg_votes|
|---------|
|84442.0  |

Opdracht: ...afgerond op het dichtstbijzijnde honderdtal

SELECT ROUND(AVG(num_votes), -2) AS avg_votes
FROM reviews;
|avg_votes|
|---------|
|84400    |
Gevorderde SQL-query’s met AI

Groepsgemiddelden

Opdracht: Toon het gemiddelde afgeronde budget per taal, gesorteerd op hoogste budget eerst

SELECT language, ROUND(AVG(budget)) AS average_budget
FROM films
GROUP BY language
ORDER BY average_budget DESC;
|language |average_budget|
|---------|--------------|
|Greek    |              |
|Kannada  |              |    
|Polish   |              |
|Korean   |2741550000    |
...
Gevorderde SQL-query’s met AI

Minimum en maximum

Opdracht: Toon de laagste en hoogste budgetten per land, alfabetisch gesorteerd

SELECT country, 
       MIN(budget) AS lowest_budget, 
       MAX(budget) AS highest_budget
FROM films
GROUP BY country
ORDER BY country;
|country    |lowest_budget|highest_budget|
|-----------|-------------|--------------|
|Afghanistan|46000        |46000         |
|Argentina  |800000       |2000000       |
|Aruba      |35000000     |35000000      |
...

$$

$$

  • Bereik identificeren
  • Omvang van data begrijpen
  • Typische waarde begrijpen
Gevorderde SQL-query’s met AI

Aggregatiefuncties en datatypes

Alleen numerieke velden

  • SUM()
  • AVG()

Verschillende datatypes

  • MIN()
  • MAX()
  • COUNT()

$$

Minimum <-> Maximum

  • Laagste <-> Hoogste
  • A <-> Z
  • Vroegste <-> Meest recent
Gevorderde SQL-query’s met AI

Minimum en maximum

SELECT MIN(language) AS min_language
FROM films;
|min_language|
|------------|
|Aboriginal  |
SELECT MAX(language) AS max_language
FROM films;
|max_language|
|------------|
|Zulu        |
Gevorderde SQL-query’s met AI

SQL best practices: aliassen

SELECT SUM(budget) AS total_budget
...
SELECT AVG(budget) AS average_budget
...
SELECT country, 
       MIN(budget) AS lowest_budget, 
       MAX(budget) AS highest_budget
...
SELECT AVG(num_user), AVG(num_critic)
FROM reviews;
|avg     |avg     |
|275.6...|141.9...|
Gevorderde SQL-query’s met AI

SQL best practices: opmaak

 

  • Schrijf queries op meerdere regels
  • Gebruik inspringing
SELECT country, 
       MIN(budget) AS lowest_budget, 
       MAX(budget) AS highest_budget
FROM films
GROUP BY country
ORDER BY country;

Bril op papier

SQL icoon

Gevorderde SQL-query’s met AI

Klaar om te analyseren?

Gevorderde SQL-query’s met AI

Preparing Video For Download...