Nihai örnek

SQL ile Veri Odaklı Karar Verme

Tim Verdonck

Professor Statistics and Data Science

İş Vakası

  • MovieNow yeni filmlere yatırım yapmayı düşünüyor.
  • MovieNow için yeni üretilen filmleri sunmak, eski filmlere kıyasla daha pahalıdır.
  • Veri analizinin ilk adımı:
    • Müşteriler yeni filmleri, eski filmlere göre daha mı yüksek puanlıyor?
    • Ülkeler arasında fark var mı?
SQL ile Veri Odaklı Karar Verme

1. Verileri birleştirme

  • Gerekli bilgiler:
    • renting: kiralama ve puan kayıtları
    • customers: müşterinin ülke bilgisi
    • movies: filmin vizyon yılı
      SELECT *
      FROM renting AS r
      LEFT JOIN customers AS c
      ON c.customer_id = r.customer_id
      LEFT JOIN movies AS m
      ON m.movie_id = r.movie_id;
      
SQL ile Veri Odaklı Karar Verme

2. İlgili kayıtları seçme

  • En az 4 puan alan filmlerin kayıtlarını kullanın
  • 2018-04-01 sonrası kiralamaları kullanın
SELECT *
FROM renting AS r
LEFT JOIN customers AS c
ON c.customer_id = r.customer_id
LEFT JOIN movies AS m
ON m.movie_id = r.movie_id
WHERE r.movie_id IN (
    SELECT movie_id
    FROM renting
    GROUP BY movie_id
    HAVING COUNT(rating) >= 4)
AND r.date_renting >= '2018-04-01';
SQL ile Veri Odaklı Karar Verme

3. Toplama

Toplama türü:

  • Kiralama sayısını sayın
  • Farklı film sayısını sayın
  • Ortalama puanı hesaplayın

Toplama düzeyleri:

  • Toplam toplama
  • Vizyon yılına göre filmler
  • Vizyon yılına ve müşterinin ülkesine göre ayrı ayrı filmler
SQL ile Veri Odaklı Karar Verme

3. Toplama

SELECT c.country,
       m.year_of_release,
       COUNT(*) AS n_rentals,
       COUNT(DISTINCT r.movie_id) AS n_movies,
       AVG(rating) AS avg_rating
FROM renting AS r
LEFT JOIN customers AS c
ON c.customer_id = r.customer_id
LEFT JOIN movies AS m
ON m.movie_id = r.movie_id
WHERE r.movie_id IN (
    SELECT movie_id
    FROM renting
    GROUP BY movie_id
    HAVING COUNT(rating) >= 4)
AND r.date_renting >= '2018-04-01'
GROUP BY ROLLUP (m.year_of_release, c.country)
ORDER BY c.country, m.year_of_release;
SQL ile Veri Odaklı Karar Verme

Ortaya çıkan tablo

| year_of_release | country | n_rentals | n_movies | avg_rating         |
|-----------------|---------|-----------|----------|--------------------|
| 2009            | null    | 10        | 1        | 8.7500000000000000 | 
| 2010            | null    | 41        | 5        | 7.9629629629629630 | 
| 2011            | null    | 14        | 2        | 8.2222222222222222 | 
| 2012            | null    | 28        | 5        | 8.1111111111111111 | 
| 2013            | null    | 10        | 2        | 7.6000000000000000 | 
| 2014            | null    | 5         | 1        | 8.0000000000000000 | 
| null            | null    | 333       | 50       | 7.9024390243902439 |
SQL ile Veri Odaklı Karar Verme

Haydi pratik yapalım!

SQL ile Veri Odaklı Karar Verme

Preparing Video For Download...