Identificar atores favoritos por grupo de clientes

Tomada de decisão orientada por dados em SQL

Irene Ortner

Data Scientist at Applied Statistics

Combinando instruções SQL em uma consulta

  • LEFT JOIN
  • WHERE
  • GROUP BY
  • HAVING
  • ORDER BY
Tomada de decisão orientada por dados em SQL

Dos aluguéis aos dados de cliente e ator

Nossa pergunta: Quem é o ator favorito de um certo grupo de clientes?

Junta a tabela renting com

  • customers
  • actsin
  • actors
SELECT *
FROM renting as r
LEFT JOIN customers AS c
ON r.customer_id = c.customer_id
LEFT JOIN actsin as ai
ON r.movie_id = ai.movie_id
LEFT JOIN actors as a
ON ai.actor_id = a.actor_id;
Tomada de decisão orientada por dados em SQL

Clientes homens

  • Atores que mais aparecem em filmes vistos por clientes homens.
SELECT a.name, 
       COUNT(*)
FROM renting as r
LEFT JOIN customers AS c
ON r.customer_id = c.customer_id
LEFT JOIN actsin as ai
ON r.movie_id = ai.movie_id
LEFT JOIN actors as a
ON ai.actor_id = a.actor_id

WHERE c.gender = 'male'
GROUP BY a.name;
Tomada de decisão orientada por dados em SQL

Quem é o ator favorito?

  • Ator mais assistido.
  • Melhor média de avaliação quando assistido.
SELECT a.name, 
       COUNT(*) AS number_views, 
       AVG(r.rating) AS avg_rating
FROM renting as r
LEFT JOIN customers AS c
ON r.customer_id = c.customer_id
LEFT JOIN actsin as ai
ON r.movie_id = ai.movie_id
LEFT JOIN actors as a
ON ai.actor_id = a.actor_id

WHERE c.gender = 'male'
GROUP BY a.name;
Tomada de decisão orientada por dados em SQL

Adiciona HAVING e ORDER BY

SELECT a.name, 
       COUNT(*) AS number_views, 
       AVG(r.rating) AS avg_rating
FROM renting as r
LEFT JOIN customers AS c
ON r.customer_id = c.customer_id
LEFT JOIN actsin as ai
ON r.movie_id = ai.movie_id
LEFT JOIN actors as a
ON ai.actor_id = a.actor_id

WHERE c.gender = 'male'
GROUP BY a.name
HAVING AVG(r.rating) IS NOT NULL
ORDER BY avg_rating DESC, number_views DESC;
Tomada de decisão orientada por dados em SQL

Adiciona HAVING e ORDER BY

| name               | number_views | avg_rating |
|--------------------|--------------|------------|
| Ray Romano         | 3            | 10.00      |
| Sean Bean          | 2            | 10.00      |
| Leonardo DiCaprio  | 3            | 9.33       |
| Christoph Waltz    | 3            | 9.33       |
Tomada de decisão orientada por dados em SQL

Vamos praticar!

Tomada de decisão orientada por dados em SQL

Preparing Video For Download...