İleri veri analizi desenleri

Databricks SQL'e Giriş

Kevin Barlow

Data Manager

Motivasyon

Göl Evi Diyagramı - Analiz

Databricks SQL'e Giriş

Alt sorgular

  • SQL sorgularını “iç içe” yazarak yapılır
    • İç içe sorgu yeni bir “tablo” gibi düşünülür
    • Bir görünüm oluşturmaya benzer
  • Birçok kullanım için idealdir
    • Başka bir sorgunun sonucunu almak
    • Karmaşık sorguları basitleştirmek
    • Sorgu içinde toplulaştırma yapmak
SELECT store, totalRev, product
FROM (
    SELECT count(*) as count,
          sum(revenue) as totalRev,
          min(price) as minPrice,
          max(units) as maxUnits,
          region,
          store,
          product
      FROM sales 
      GROUP BY region, store, product
) q
Databricks SQL'e Giriş

Pencere işlevleri

  • SQL işlevleri ve tekniklerinin bir kategorisi
  • Belirli bir satır aralığı üzerinde hesaplama yapar
    • Satırlar birbiriyle ilişkilidir
  • Örnekler:
    • Bir zaman aralığına göre metrik hesaplama
    • Ardışık satırlarda değişimi hesaplama
    • Birden çok boyutta hesaplama
SELECT name,
       dept,
       RANK() OVER 
           (PARTITION BY dept 
         ORDER BY salary) AS rank
  FROM employees;
name dept salary rank
Lisa Sales 10000 1
Alex Sales 30000 2
Fred Engineering 21000 1
Tom Engineering 23000 2
Databricks SQL'e Giriş

Gelişmiş Databricks SQL işlevleri

RANK()

  • Verilen bir bölüm içinde satırları karşılaştırır ve her satıra bir sıra atar
SELECT a,
       b,
       RANK() OVER(PARTITION BY a ORDER BY b DESC),
    FROM table_name;
a b rank
A1 3 1
A1 1 3
A1 2 2
A2 1 1

LAG() ve LEAD()

  • Önceki (LAG()) veya sonraki (LEAD()) satırdaki değeri döndürür
SELECT a,
       b,
       LAG(b) OVER (PARTITION BY a ORDER BY b)
    FROM table_name;
a b lag
A1 3 NULL
A1 1 3
A1 2 1
A2 1 NULL
Databricks SQL'e Giriş

Hadi pratik yapalım!

Databricks SQL'e Giriş

Preparing Video For Download...