BigQuery’de özel toplulaştırmalar

BigQuery'ye Giriş

Matthew Forrest

Field CTO

Özel toplu fonksiyonlara giriş

Function Category Description
APPROX_COUNT_DISTINCT, APPROX_QUANTILES, APPROX_TOP_COUNT, APPROX_TOP_SUM Yaklaşık toplulaştırma Bazı hesaplamalar için tahminler sağlar; süre ve kaynak kullanımını azaltır.
ARRAY_CONCAT_AGG, STRING_AGG Dizi ve metin işlemleri Dizileri ve metinleri toplar, birleştirir ve işler.
LOGICAL_AND, LOGICAL_OR Mantıksal işlemler Boolean ifadeler kümesinde VE ve VEYA işlemlerini değerlendirir.
BigQuery'ye Giriş

ARRAY_CONCAT_AGG

  • ARRAY_CONCAT_AGG(), ARRAY_AGG() kısıtlarını giderir
SELECT
  order_id,
  ARRAY_CONCAT_AGG(order_items) AS all_items
FROM sales_data
GROUP BY order_id;
| order_id | all_items                          |
|----------|------------------------------------|
| 1        | [shoes, electronics]               |
| 2        | [electronics, household, clothing] |
BigQuery'ye Giriş

STRING_AGG

  • STRING_AGG() metinleri tek bir metinde birleştirir
SELECT STRING_AGG(customer_id, ', ') AS all_customers
FROM sales_data
WHERE delivery_date 
BETWEEN CURRENT_TIMESTAMP() 
AND TIMESTAMP_ADD(CURRENT_TIMESTAMP(), INTERVAL 3 DAY) ;
| all_customers   |
|-----------------|
| 123, 456, 789   |
BigQuery'ye Giriş

APPROX_COUNT_DISTINCT

  • APPROX_COUNT_DISTINCT() farklı değer sayısını hızlıca kabaca tahmin eder
SELECT
  customer_id,
  APPROX_COUNT_DISTINCT(order_id) AS unique_orders
FROM sales_data
GROUP BY customer_id;
| customer_id | unique_orders |
|-------------|---------------|
| 1           | 5             |
| 2           | 2             |
BigQuery'ye Giriş

APPROX_QUANTILES

  • APPROX_QUANTILES() yaklaşık kantil değerlerini döndürür
SELECT
  category,
  APPROX_QUANTILES(value, 4) AS quartiles
FROM sales_data
GROUP BY category;
| category    | quartiles         |
|-------------|-------------------|
| shoes       | [25, 40, 55, 100] |
| electronics | [10, 40, 95, 300] |
BigQuery'ye Giriş

APPROX_TOP_COUNT

  • APPROX_TOP_COUNT() oluşumlara göre en iyi K öğeyi bulur
SELECT
  category,
  APPROX_TOP_COUNT(customer_id, 3) AS customers
FROM sales_data
GROUP BY category;
| category    | customers   |
|-------------|-------------|
| shoes       | [1, 7, 19]  |
| electronics | [8, 19, 22] |
BigQuery'ye Giriş

APPROX_TOP_SUM

  • APPROX_TOP_SUM(el, weight, K), weighte göre en iyi K öğe el’i bulur
SELECT
  seller_id,
  APPROX_TOP_SUM(item_id, cost, 3) AS top_items
FROM sales_data
GROUP BY seller_id;
| seller_id | top_items                                    |
|-----------|----------------------------------------------|
| 1         | [[1024, 5000], [1567, 3000], [3489, 2000]]   |
| 2         | [[5647, 6500], [9867, 3500], [1074, 2100]]   |
BigQuery'ye Giriş

LOGICAL_AND ve LOGICAL_OR

SELECT
  customer_id,
  -- tümü true ise true
  LOGICAL_AND(order_status = 'shipped') AS all_shipped,
  -- en az biri true ise true
  LOGICAL_OR(order_status = 'shipped') AS one_shipped
FROM sales_data
GROUP BY customer_id;
| customer_id | all_shipped | one_shipped |
|-------------|-------------|-------------|
| 1           | false       | true        |
| 2           | true        | true        |
BigQuery'ye Giriş

Hadi pratik yapalım!

BigQuery'ye Giriş

Preparing Video For Download...