Datavisualisatie in Databricks
Gang Wang
Senior Data Scientist

Gang Wang
Senior Data Scientist
Origin Energy, Australië (2021-heden)
9+ jaar ervaring na PhD
Datavisualisatie is het weergeven van data in visuele vorm.
Vormen: grafieken, diagrammen, kaarten en infographics.
Hoofddoel:


Voordelen:

Discrete versus continue data
Beschrijvende statistiek

Voordelen:

Dataset: NYC Taxi-dataset van Databricks
Bevat: ophaal- en afzetlocaties, tijden, afstand en ritprijs
| Kolomnaam | Details |
|---|---|
| tpep_pickup_datetime | Datum en tijd waarop de rit begon |
| tpep_dropoff_datetime | Datum en tijd waarop de rit eindigde |
| trip_distance | Ritafstand in mijlen |
| fare_amount | Ritprijs in dollars |
| pickup_zip | Postcode waar de passagier instapte |
| dropoff_zip | Postcode waar de passagier uitstapte |
Datavisualisatie in Databricks