Pengantar Databricks Lakehouse

Konsep Databricks

Kevin Barlow

Data Analytics Practitioner

Gudang Data

Gudang Data

Kelebihan

  • Unggul untuk data terstruktur
  • Performa tinggi
  • Mudah menjaga data tetap bersih

Kekurangan

  • Sangat mahal
  • Tidak mendukung aplikasi modern
  • Tidak dibuat untuk Machine Learning

Gudang Data

1 https://www.databricks.com/blog/2021/05/19/evolution-to-the-data-lakehouse.html
Konsep Databricks

Data Lake

Gambar Data Lake

Data Lake

Kelebihan

  • Mendukung semua use case
  • Sangat fleksibel
  • Hemat biaya

Kekurangan

  • Data bisa menjadi berantakan
  • Secara historis kurang bertenaga
1 https://www.databricks.com/blog/2021/05/19/evolution-to-the-data-lakehouse.html
Konsep Databricks

Kelahiran Lakehouse

Gudang Data dan Data Lake

1 https://www.databricks.com/blog/2021/05/19/evolution-to-the-data-lakehouse.html
Konsep Databricks

Kelahiran Lakehouse

Kelahiran Arsitektur Lakehouse

1 https://www.databricks.com/blog/2021/05/19/evolution-to-the-data-lakehouse.html
Konsep Databricks

Databricks Lakehouse

Platform Databricks Lakehouse

  • Satu platform untuk semua beban kerja data
  • Dibangun di atas teknologi open source
  • Lingkungan kolaboratif
  • Arsitektur sederhana

Diagram Tingkat-Tinggi Databricks Lakehouse

1 https://www.databricks.com/blog/2021/05/19/evolution-to-the-data-lakehouse.html
Konsep Databricks

Manfaat Arsitektur Databricks

Unifikasi

  • Semua use case dari AI hingga BI
  • Manfaat gudang data dan data lake

Aplikasi Analitik Terpadu

Multi-Cloud

  • Bawa platform kuat ke data Anda
  • Tanpa terkunci pada satu cloud tertentu

Multi Cloud

Konsep Databricks

Manfaat Pengembangan di Databricks

Kolaboratif

  • Semua peran data
  • Dapat bekerja di platform yang sama secara real-time

Tim Kolaboratif

Open Source

  • Didukung Apache Spark
  • Dukungan untuk bahasa populer (Python, R, Scala, SQL)

Open Source

Konsep Databricks

Ayo berlatih!

Konsep Databricks

Preparing Video For Download...