Visualisasi Data di Databricks
Gang Wang
Senior Data Scientist

Gang Wang
Senior Data Scientist
Origin Energy, Australia (2021–sekarang)
Pengalaman pasca-PhD 9+ tahun
Visualisasi data adalah praktik menyajikan data dalam format visual.
Format: termasuk bagan garis, batang, peta, dan infografik.
Tujuan utama:


Manfaat:

Data diskret vs. kontinu
Statistik deskriptif

Manfaat:

Dataset: Dataset Taksi NYC dari Databricks
Berisi: lokasi naik/turun, waktu, jarak, dan tarif
| Nama Kolom | Detail |
|---|---|
| tpep_pickup_datetime | Tanggal dan waktu saat perjalanan dimulai |
| tpep_dropoff_datetime | Tanggal dan waktu saat perjalanan berakhir |
| trip_distance | Jarak perjalanan (mil) |
| fare_amount | Tarif perjalanan (dolar) |
| pickup_zip | Kode ZIP lokasi penjemputan |
| dropoff_zip | Kode ZIP lokasi penurunan |
Visualisasi Data di Databricks