Tabloların kalıcılığı ve kapsamı

Databricks'te Veri Yönetimi

Smriti Mishra

Founder, NordData Insight

Tablo kalıcılığı nedir?

  • Tablo kalıcılığı, veri depolama ve saklamayı belirler
  • Depolama, erişim ve bakımı etkiler
  • Databricks yönetilen ve yönetilmeyen tabloları destekler

Dosyaları dolaplarda depolayan ve inceleyen kişilerin çizimi

Databricks'te Veri Yönetimi

Databricks'te yönetilen tablolar

  • Veri konumu ve yaşam döngüsü dahil, Databricks tarafından tamamen yönetilir.
  • Tablo silindiğinde veriyi otomatik olarak siler.
  • Basit, merkezi veri yönetimi için uygundur.

Farklı renkli noktalarla merkezî bir sistemin nasıl çalıştığını gösteren görsel

Databricks'te Veri Yönetimi

Databricks'te yönetilmeyen tablolar

  • Merkezî olmayan yaklaşım
  • Veri depolama konumu ve yaşam döngüsünü siz kontrol edersiniz
  • Yönetilmeyen bir tabloyu silmek veriyi silmez
  • Özel depolama veya uyumluluk gereksinimleri için yararlı

Farklı renkli noktalarla merkezî olmayan bir sistemin nasıl çalıştığını gösteren görsel

Databricks'te Veri Yönetimi

Yönetilen mi, yönetilmeyen mi?

Aspect.png

Databricks'te Veri Yönetimi

LOCATION anahtar sözcüğü

  • Yönetilmeyen tablolarda veri depolama ayarı için kritiktir.
  • Depolama konumu; maliyeti, alma süresini ve saklama ilkelerini etkiler.

 

CREATE TABLE table_name (
    column_name data_type,
    ...
)
USING file_format
LOCATION 'path/to/data';
Databricks'te Veri Yönetimi

Önemli çıkarımlar

  • Yönetilen tablolar depolama ve yaşam döngüsünü Databricks içinde merkezileştirir.
  • Yönetilmeyen tablolar depolama ve veri yaşam döngüsünde esneklik sunar.
  • Seçimi; depolama, kontrol ve yönetim gereksinimlerine göre yapın.

Veri depolama ve yaşam döngüsü yönetimini gösteren görsel

Databricks'te Veri Yönetimi

Hadi pratik yapalım!

Databricks'te Veri Yönetimi

Preparing Video For Download...