Daha Fazla Özet Fonksiyonu

SQL ile Keşifsel Veri Analizi

Christina Maimone

Data Scientist

Korelasyon

Pozitif ve negatif korelasyonlu veri noktalarının saçılım grafikleri

SQL ile Keşifsel Veri Analizi

Korelasyon fonksiyonu

SELECT corr(assets, equity) 
  FROM fortune500;
       corr        
-------------------
 0.637710143588615
(1 row)
SQL ile Keşifsel Veri Analizi

Medyan

1 1 4 4 4 5 6 7 13 19 20 20 21 21 22
              ^
            median
        50th percentile

^                                  ^
0th percentile      100th percentile
SQL ile Keşifsel Veri Analizi

Yüzdelik (percentile) fonksiyonları

SELECT percentile_disc(percentile) WITHIN GROUP (ORDER BY column_name)
  FROM table;

-- percentile between 0 and 1
  • Sütundan bir değer döndürür

 

SELECT percentile_cont(percentile) WITHIN GROUP (ORDER BY column_name)
  FROM table;
  • Değerler arasında enterpole eder
SQL ile Keşifsel Veri Analizi

Yüzdelik örnekleri

SELECT val
  FROM nums;
 val 
-----
   1
   3
   4
   5
(4 rows)
SELECT percentile_disc(.5) WITHIN GROUP (ORDER BY val),
       percentile_cont(.5) WITHIN GROUP (ORDER BY val)
  FROM nums;
 percentile_disc | percentile_cont 
-----------------+-----------------
               3 |             3.5
SQL ile Keşifsel Veri Analizi

Yaygın sorunlar

  • Hata kodları
    • Örnekler: 9, 99, -99
  • Eksik değer kodları
    • NA, NaN, N/A, #N/A
    • 0 = eksik mi yoksa 0 mı?
  • Aykırı (uç) değerler
    • Çok mu yüksek ya da düşük?
    • Negatif değerler?
  • Aslında sayı değil
    • Örnekler: posta kodları, anket yanıt kategorileri
SQL ile Keşifsel Veri Analizi

Hadi pratik yapalım!

SQL ile Keşifsel Veri Analizi

Preparing Video For Download...