Platform Kecerdasan Data - Data

Pengantar Databricks

Kevin Barlow

Data Analytics Practitioner

Mengapa organisasi peduli pengelolaan data?

Perlindungan dan keamanan

Keamanan Data

Kepercayaan pada data

Analitik Andal

Pengantar Databricks

Jenis data

Terstruktur
  • Paling umum dan dipahami
  • Baris dan kolom khas
  • Contoh:
    • tabel database
    • .csv
    • Parquet
    • Delta
id nama pekerjaan lokasi
1 Kevin Data Scientist California
2 Tom Arsitek Arizona
3 Sally Pengacara Texas
4 Tina Ahli Bedah Florida
5 Joe Insinyur New York
Pengantar Databricks

Jenis data

Semi-terstruktur
  • Umum pada perangkat berbasis web
  • Ada struktur, konten lebih fleksibel
  • Contoh:
    • JSON
    • XML
    • HTML
{
  "people": [{
      "id": 1,
      "name": "Kevin",
      "occupation": "Data Scientist",
      "location": "California"},
    {
      "id": 2,
      "name": "Tom",
      "occupation": "Architect",
      "location": "Arizona"}]
}
Pengantar Databricks

Jenis data

Tidak terstruktur
  • Umum pada perangkat pintar, kamera, dll.
  • Minim struktur, kaya informasi
  • Contoh:
    • JPEG
    • PNG
    • MP4
    • PDF
    • DOC

Diagram Data Tidak Terstruktur

Pengantar Databricks

Delta

delta.io

  • Format penyimpanan open-source
  • Kumpulan tabel Parquet
  • Log transaksi JSON
  • Sepenuhnya patuh ACID
  • Batch dan streaming

Delta Lake

Pengantar Databricks

Unity Catalog

Model Data Unity Catalog

1 https://docs.databricks.com/en/data-governance/unity-catalog/index.html#the-unity-catalog-object-model
Pengantar Databricks

Unity Catalog

Model Data Unity Catalog

GRANT, SHOW, REVOKE, USE ...

Pengantar Databricks

Catalog Explorer

  • Satu tempat untuk eksplor semua aset data
  • UI untuk menemukan data
  • Kelola izin Unity Catalog
  • Lihat lineage dan aset terkait

Tangkapan Layar Catalog Explorer

Pengantar Databricks

Ayo berlatih!

Pengantar Databricks

Preparing Video For Download...