Identificar a los actores favoritos de los grupos de clientes

Toma de decisiones basada en datos en SQL

Irene Ortner

Data Scientist at Applied Statistics

Combinación de sentencias SQL en una consulta

  • LEFT JOIN
  • WHERE
  • GROUP BY
  • HAVING
  • ORDER BY
Toma de decisiones basada en datos en SQL

Desde el alquiler de discos hasta la información sobre clientes y actores.

Nuestra pregunta ¿Quién es el actor favorito de un determinado grupo de clientes?

Une la tabla renting con las tablas

  • customers
  • actsin
  • actors
SELECT *
FROM renting as r
LEFT JOIN customers AS c
ON r.customer_id = c.customer_id
LEFT JOIN actsin as ai
ON r.movie_id = ai.movie_id
LEFT JOIN actors as a
ON ai.actor_id = a.actor_id;
Toma de decisiones basada en datos en SQL

Clientes masculinos

  • Actores que aparecen con más frecuencia en las películas que ven los clientes masculinos.
SELECT a.name, 
       COUNT(*)
FROM renting as r
LEFT JOIN customers AS c
ON r.customer_id = c.customer_id
LEFT JOIN actsin as ai
ON r.movie_id = ai.movie_id
LEFT JOIN actors as a
ON ai.actor_id = a.actor_id

WHERE c.gender = 'male'
GROUP BY a.name;
Toma de decisiones basada en datos en SQL

¿Quién es tu actor favorito?

  • Actor más visto.
  • Mejor puntuación media cuando se está viendo.
SELECT a.name, 
       COUNT(*) AS number_views, 
       AVG(r.rating) AS avg_rating
FROM renting as r
LEFT JOIN customers AS c
ON r.customer_id = c.customer_id
LEFT JOIN actsin as ai
ON r.movie_id = ai.movie_id
LEFT JOIN actors as a
ON ai.actor_id = a.actor_id

WHERE c.gender = 'male'
GROUP BY a.name;
Toma de decisiones basada en datos en SQL

Añade HAVING y ORDER BY

SELECT a.name, 
       COUNT(*) AS number_views, 
       AVG(r.rating) AS avg_rating
FROM renting as r
LEFT JOIN customers AS c
ON r.customer_id = c.customer_id
LEFT JOIN actsin as ai
ON r.movie_id = ai.movie_id
LEFT JOIN actors as a
ON ai.actor_id = a.actor_id

WHERE c.gender = 'male'
GROUP BY a.name
HAVING AVG(r.rating) IS NOT NULL
ORDER BY avg_rating DESC, number_views DESC;
Toma de decisiones basada en datos en SQL

Añade HAVING y ORDER BY

| name               | number_views | avg_rating |
|--------------------|--------------|------------|
| Ray Romano         | 3            | 10.00      |
| Sean Bean          | 2            | 10.00      |
| Leonardo DiCaprio  | 3            | 9.33       |
| Christoph Waltz    | 3            | 9.33       |
Toma de decisiones basada en datos en SQL

¡Vamos a practicar!

Toma de decisiones basada en datos en SQL

Preparing Video For Download...