Snowflake'ta Pencere Fonksiyonları
Jake Roach
Field Data engineer
Spor salonu üyelerini antrenmanlarına göre nasıl sınıflandırabiliriz ve doğru dersleri pazarlayabiliriz?
member_id | gym_location | calories_burned | marketing_group
----------- | -------------- | ----------------- | -----------------
m_192 | Miami | 45 | 1
m_74 | Miami | 59 | 1
m_233 | Portland | 60 | 1
m_14 | Cleveland | 72 | 2
m_346 | Portland | 77 | 2
m_289 | Cleveland | 81 | 2
m_565 | Miami | 1085 | 50
...
SELECT <fields>, <2>, <1>,NTILE(<n>) OVER( PARTITION BY <2> ORDER BY <1> )...;
NTILE, "N" sayıda eşit büyüklükte "grup" oluşturmak için kullanılır
$$
<n>: grup sayısı
<1>: grup oluşturmak için kullanılan alan
<2>: PARTITION BY kullanarak kayıtları eşit dağıtmak için kullanılan alan
SELECT member_id, gym_location, calories_burned, -- 50 eşit büyüklükte veri grubu oluşturNTILE(50) OVER( ORDER BY calories_burned -- Her gruptaki kayıtları belirler ) AS marketing_groupFROM FITNESS.workouts ORDER BY marketing_group, calories_burned; -- Sonuç kümesini sırala
member_id | gym_location | calories_burned | marketing_group
----------- | -------------- | ----------------- | -----------------
m_192 | Miami | 45 | 1
m_74 | Miami | 59 | 1
m_233 | Portland | 60 | 1
m_14 | Cleveland | 72 | 2
m_346 | Portland | 77 | 2
m_289 | Cleveland | 81 | 2
m_565 | Miami | 1085 | 50
...
SELECT member_id, gym_location, calories_burned, NTILE(50) OVER(-- Her gym_location için kayıtları eşit dağıt PARTITION BY gym_locationORDER BY calories_burned ) AS marketing_group FROM FITNESS.workouts ORDER BY marketing_group, calories_burned;
member_id | gym_location | calories_burned | marketing_group
----------- | -------------- | ----------------- | -----------------
m_192 | Miami | 45 | 1
m_233 | Portland | 60 | 1
m_14 | Cleveland | 72 | 1
m_74 | Miami | 59 | 2
m_346 | Portland | 77 | 2
m_289 | Cleveland | 81 | 2
...
$$
$$
member_id | cals_burned | cd
----------- | ------------- | ------
m_192 | 45 | .016
m_74 | 59 | .033
m_233 | 60 | .049
m_14 | 72 | .066
m_346 | 77 | .082
m_289 | 81 | .098
....
m_565 | 1085 | 1.000
SELECT member_id, gym_location, calories_burned, CUME_DIST() OVER( PARTITION BY gym_location, -- Her konum için bir dağılım oluştur ORDER BY calories_burned ) AS cd FROM FITNESS.workoutsORDER BY gym_location, cd; -- Sonuç kümesini sırala
SELECT <fields>, <1>, <2>,CUME_DIST() OVER( PARTITION BY <1> ORDER BY <2> )...;
Her kaydı o sütun/alan için dağılımla karşılaştırır, kümülatif dağılım
$$
<1>: değerlendirilecek pencereyi belirleyen alan
<2>: dağılım oluşturulacak alan
$$
member_id | gym_location | calories_burned | cd
----------- | -------------- | ---------------- | -------
m_192 | Miami | 45 | .033
m_74 | Miami | 59 | .066
m_288 | Miami | 83 | .098
m_541 | Miami | 85 | .131
...
m_233 | Portland | 60 | .071
m_346 | Portland | 77 | .142
...
Snowflake'ta Pencere Fonksiyonları