Veri ambarları ve veri gölleri

Veri Mühendisliğini Anlamak

Hadrien Lacroix

Content Developer

Göl manzaralı ambarlar

Veri Mühendisliğini Anlamak

veri hattı

Veri Mühendisliğini Anlamak

Veri gölleri ve veri ambarları

Veri gölü

  • Tüm ham verileri depolar
  • Petabaytlara çıkabilir (1 milyon GB)
  • Tüm veri yapıları depolanır
  • Maliyet etkindir
  • Analizi zordur
  • Güncel bir veri katalogu gerektirir
  • Veri bilimcilerce kullanılır
  • Büyük veri, gerçek zamanlı analiz

Veri ambarı

  • Belirli kullanım için seçili veri
  • Nispeten küçüktür
  • Ağırlıkla yapısal veri depolar
  • Güncellemesi daha maliyetlidir
  • Veri analizi için optimize edilmiştir
  • Veri analistleri ve iş analistleri de kullanır
  • Ad-hoc, salt-okunur sorgular
Veri Mühendisliğini Anlamak

Veri gölleri için veri katalogu

  • Bu verinin kaynağı nedir?
  • Bu veri nerede kullanılır?
  • Verinin sahibi kimdir?
  • Bu veri ne sıklıkla güncellenir?
  • Veri yönetişimi için iyi uygulama
  • Tekrarlanabilirliği sağlar
  • Katalog yoksa --> veri bataklığı
  • Her veri depolama çözümü için iyi uygulama
    • Güvenilirlik
    • Özerklik
    • Ölçeklenebilirlik
    • Hız
Veri Mühendisliğini Anlamak

Veritabanı vs. veri ambarı

  • Veritabanı:
    • Genel terim
    • Kabaca, bilgisayarda depolanan ve erişilen düzenli veri
  • Veri ambarı bir veritabanı türüdür
Veri Mühendisliğini Anlamak

Özet

  • Veri gölleri
  • Veri ambarları
  • Veritabanları
  • Veri katalogu
Veri Mühendisliğini Anlamak

Hadi pratik yapalım!

Veri Mühendisliğini Anlamak

Preparing Video For Download...