İlişkisel Veriyi Normalize Etme

Snowflake ile Veri Modellemesine Giriş

Nuno Rocha

Director of Engineering

Normalize edilmemiş veriyi anlama

  • Normalize edilmemiş veri (UNF): Yapısı eksik, düzensiz, tekrarlar ve/veya anomaliler içerebilen veri

Tüm ürünler varlığı

Snowflake ile Veri Modellemesine Giriş

Normalize edilmemiş veriyi anlama

Tüm ürünler varlığındaki anomaliler

Snowflake ile Veri Modellemesine Giriş

Normalize edilmemiş veriyi anlama

Muz anomalisi vurgulandı

Snowflake ile Veri Modellemesine Giriş

Normalize edilmemiş veriyi anlama (3)

Üretici anomalisi vurgulandı

Snowflake ile Veri Modellemesine Giriş

Normalize edilmemiş veriyi anlama (4)

Detay açıklama anomalisi vurgulandı

Snowflake ile Veri Modellemesine Giriş

Normalize edilmemiş veriyi anlama (5)

Ürünlerde anomali vurgulandı

Snowflake ile Veri Modellemesine Giriş

Normalize edilmemiş verinin sorunları

  • Veri fazlalığı: Gereksiz tekrarlar
  • Veri anomalileri: Düzensizlikler veya tutarsızlıklar

Tüm ürünler varlığındaki anomaliler

Snowflake ile Veri Modellemesine Giriş

Normalize edilmemiş veriyi belirleme

SELECT manufacturer_id, 
       manufacturer_name, 
       location, 
       COUNT(*) AS repetitions
FROM allproducts
GROUP BY manufacturer_id, 
    manufacturer_name, 
    location
HAVING COUNT(*) > 1;

Üreticiler ve ürün tekrar sayıları listesi

Snowflake ile Veri Modellemesine Giriş

Normalize edilmemiş veriyi belirleme

SELECT DISTINCT category 
FROM allproducts;

Kategori listesi

Snowflake ile Veri Modellemesine Giriş

Normalize edilmemiş veriyi belirleme

SELECT DISTINCT product_name,
    category
FROM allproducts
WHERE category = 'L';

L kategorisindeki ürünler listesi

Snowflake ile Veri Modellemesine Giriş

Normalize edilmemiş veriyi belirleme

SELECT DISTINCT product_name,
    category
FROM allproducts
WHERE category = 'L';

L içeren tüm ürünler listesi

Snowflake ile Veri Modellemesine Giriş

Normalize veri

  • Normalize veri: Verinin ayrı ve atomik varlıklara düzenlenmesi
  • Faydalar:
    • Doğruluk ve güvenilirlik artar
    • Sorgu performansı iyileşir
    • Kaynak kullanımı optimize edilir
    • Ölçeklenebilirlik
Snowflake ile Veri Modellemesine Giriş

Terimler ve işlevlere genel bakış

  • Normalize edilmemiş veri (UNF): Yapısı eksik, düzensiz veya tekrar/anomali içerebilir
  • Normalize veri: Veri ayrı ve atomik varlıklara düzenlenir
  • SELECT FROM: Belirli bir varlıktan veri getirir
  • DISTINCT: Bir öznitelikteki benzersiz değerleri döndürür
  • COUNT: Koşulu sağlayan satır sayısını verir
  • GROUP BY: Satırları belirtilen özniteliklere göre grupla
  • HAVING: GROUP BY sonrası grupları koşula göre filtreler
  • WHERE: Kayıtları koşula göre filtreler
  • AS: Sütun veya tabloya takma ad verir
Snowflake ile Veri Modellemesine Giriş

İşlevlere genel bakış

-- Belirli bir koşulla filtrelenirken benzersiz değerleri sorgulama
SELECT DISTINCT column_name
FROM table_name
WHERE column_name  condition  value;
-- Belirli bir sütuna göre gruplayıp sonuçları sayma ve filtreleme
SELECT column_name, 
    COUNT(*) AS alias_name
FROM table_name
GROUP BY column_name
HAVING COUNT(*)  condition  value;
Snowflake ile Veri Modellemesine Giriş

Haydi pratik yapalım!

Snowflake ile Veri Modellemesine Giriş

Preparing Video For Download...