Rekayasa Data di Microsoft Fabric
Transformasi dan Analisis Data dengan Microsoft Fabric
Luis Silva
Solution Architect - Data & AI
Analitik Data End-to-End
Ingest data dari sumber dan simpan di data lake
Siapkan dan transformasikan data
Visualisasikan dan analisis data
Data Factory
Ingest, siapkan, dan transformasikan data
Dataflow dan Data Pipeline
Dataflow
Antarmuka low-code untuk ingest dan transformasi data
Mesin transformasi Power Query
Data Pipeline
Kumpulan aktivitas untuk menjalankan tugas
Jenis aktivitas:
Pemindahan data (Copy activity, Dataflow)
Transformasi data (Notebook, Stored Procedure, Script)
Kontrol (Switch, If, ForEach, Wait)
Synapse Data Engineering
Lakehouse
Notebook
Definisi Apache Spark Job
Lakehouse
Data terstruktur (tabel)
Data tidak terstruktur (file)
Notebook
Antarmuka web interaktif
Kode manipulasi data
Visualisasi data
Komentar / Penjelasan
Dukungan multi-bahasa:
PySpark (Python)
Spark (Scala)
Spark SQL (SQL)
SparkR (R)
Definisi Apache Spark Job
Kirim job batch/streaming ke kluster Spark
Alternatif atau pelengkap Notebook:
Notebook untuk eksplorasi data, prototyping, dan pengembangan kolaboratif
Spark Job Definition untuk otomatisasi kode pemrosesan data siap produksi
Synapse Data Warehouse
Berperilaku seperti gudang data relasional tradisional
Menyimpan data di OneLake dengan format terbuka Delta Lake
Memungkinkan interoperabilitas dengan beban kerja Fabric lain
Tidak perlu membuat banyak salinan data
Memilih Penyimpanan Data
Lakehouse
Data tidak terstruktur (file)
Spark sebagai antarmuka pengembangan utama
Warehouse
Data terstruktur (tabel)
T-SQL sebagai antarmuka pengembangan utama
Memilih Alat Penyalinan Data
Memilih Alat Penyalinan Data
Memilih Alat Penyalinan Data
Ayo berlatih!
Transformasi dan Analisis Data dengan Microsoft Fabric
Preparing Video For Download...