Redshift ambarının içi

Redshift’e Giriş

Jason Myers

Principal Architect

Gündem

  • Redshift kümesinin iç yapısı
    • Düğüm türleri
    • Lider düğüme özgü işlevler
    • Redshift küme depolaması
  • Önermeler
  • Redshift Spectrum
    • Veritabanı bileşenleri
    • Harici tablolar
Redshift’e Giriş

Redshift küme mimarisi

Lider Düğüm

  • Bağlantılar sağlar
  • Sorgu yürütme planları oluşturur ve dağıtır
  • Tüm sorguları çalıştırabilir
  • Özel işlevleri vardır

Hesaplama Düğümü

  • Veri depolama sağlar
  • Lider düğümden gelen kodu yerel veride çalıştırır

Redshift Kümesi

Redshift’e Giriş

Lider düğüme özgü işlevler

  • Yalnızca liderde çalışır
-- 'chocolate chip' ifadesinin 11. konumundan başlayarak
-- alt dizeyi seçme
SELECT SUBSTR('chocolate chip', 11);
chip
  • SUBSTR tablo sütunlarında hata verir
-- Tablodaki field adlı sütunun
-- 1. konumundan alt dize seçme
SELECT SUBSTR(field, 1) FROM table;
ERROR: SUBSTR() function is not 
supported (Hint: use SUBSTRING 
instead)
Redshift’e Giriş

Düğümler arası veriye bakmak

SELECT host, 
       -- Kullanılan alan yüzdesini hesaplayın:
       -- kullanılan eksi atılan veya geri kazanılabilir
       -- değerin kapasiteye bölümü
       (used - tossed) / capacity * 100 as percent_used 
  FROM STV_PARTITIONS;
 host |  percent_used
======+==============
  0   |  24.9
  1   |  24.8
Redshift’e Giriş

Önermeler (predicates)

SELECT table_A.columnX,
       table_B.columnY,
  FROM table_A
       INNER JOIN table_B 
          -- predicate
       ON table_B.foreign_key = table_A.primary_key 
       -- predicate
 WHERE table_B.columnZ = 'value';
  • Genelde WHERE, HAVING veya ON SQL ifadelerinde yer alan booleyen ifadeler
Redshift’e Giriş

Önerme itme-aşağı (push-down)

İtme-aşağı (PushDown)

Redshift’e Giriş

Tipik dahili veritabanı bileşenleri

Veritabanı Bileşenleri

MetaVeri Kataloğu

  • Şema bilgisini tutar (sütunlar, anahtarlar vb.)
  • Bir depolama konumuna referans verir

Sorgu Motoru

  • Sorguları planlar ve çalıştırır
  • Bağlantılar sağlar

Depolama

  • Tablo verisini tutar
  • Birden çok dosya ve tablo biçimini destekler
Redshift’e Giriş

Redshift Spectrum mimarisi

AWS Glue Data Catalog

  • "Harici" tablolarla ilgili bilgileri saklar

AWS S3 Bucket

  • Tabloyu temsil eden dosyaları saklar
  • CSV, JSON, Metin, Parquet ve daha birçok dosya türünü destekler

Redshift Spectrum Mimarisi

Redshift’e Giriş

Haydi pratik yapalım!

Redshift’e Giriş

Preparing Video For Download...