Membuat dan mengelola tabel

Manajemen Data di Databricks

Smriti Mishra

Founder, NordData Insight

Perpustakaan data

Gambar gedung perpustakaan kartun

Manajemen Data di Databricks

Buat dan kelola

  • Database Databricks mengelompokkan tabel terkait agar teratur.
  • Membuat database membangun struktur yang dapat diskalakan.
  • Data yang terorganisir memudahkan akses dan pengelolaan.
  • Tabel menyimpan data terstruktur untuk kueri.

Rak buku perpustakaan

Manajemen Data di Databricks

Pengelolaan efektif

Buang buku lama ke tempat sampah

  • Pengelolaan efektif mencakup kueri, pembaruan, dan penghapusan data.
  • Hapus data dengan hati-hati untuk menghindari kehilangan.
  • Praktik aman: buat cadangan sebelum menghapus.
Manajemen Data di Databricks

Menggunakan kata kunci LOCATION

  • Databricks mengelola lokasi penyimpanan tabel secara otomatis.
  • Default menyederhanakan manajemen penyimpanan data.
  • Jalur penyimpanan kustom dapat diatur dengan kata kunci LOCATION.
  • Fleksibilitas penting untuk kepatuhan, biaya, atau kinerja.

Rak perpustakaan kosong

Manajemen Data di Databricks

Menimpa penyimpanan default

  • LOCATION menimpa penyimpanan default.
  • Simpan data di lokasi cloud eksternal:
    • contoh: AWS S3, Azure Blob Storage
  • Berguna saat integrasi dengan infrastruktur yang ada.
  • Memastikan kepatuhan untuk data sensitif.

Gambar kartun yang mewakili rekam medis sensitif

Manajemen Data di Databricks

Manajemen data dinamis

  • LOCATION mendukung manajemen data dinamis.
  • Pindahkan data jika regulasi atau biaya berubah.
  • Relokasi tanpa gangguan operasional.
  • Jaga struktur dan alur kerja saat perubahan.

Pustakawan menata buku di rak

Manajemen Data di Databricks

Ayo berlatih!

Manajemen Data di Databricks

Preparing Video For Download...