Distributies visualiseren

Introductie tot datavisualisatie met Julia

Gustavo Vieira Suñe

Data Analyst

Uien- en tarweprijzen in Kerala, India

  • kerala DataFrame:
Date Centre Commodity Price
JAN-2001 Ernakulam Onion 10.0
JAN-2001 Ernakulam Wheat 12.5
JAN-2001 Khozhikode Onion 9.0
JAN-2001 Khozhikode Wheat 14.0
... ... ... ...
MAR-2021 Trivandrum Onion 45.0
MAR-2021 Trivandrum Wheat 34.0
  • Hoeveel verschilden de prijzen van uien en tarwe?
Commodity Mean Price
Onion 25.7442
Wheat 20.6261
Introductie tot datavisualisatie met Julia

Distributies visualiseren met histogrammen

Een histogram met de verdeling van uien- en tarweprijzen.

Introductie tot datavisualisatie met Julia

Verdeling van uien- en tarweprijzen

# Teken een histogram
histogram(
    kerala[:, :Price],

# Voeg een label toe label="Onion and Wheat", # Kies balkkleur color=:darkseagreen1, )
# Aslabels xlabel!("Price (Rupees)") ylabel!("Frequency")

Een histogram met de verdeling van uien- en tarweprijzen.

Introductie tot datavisualisatie met Julia

Aantal bins

# Teken een histogram
histogram(
    kerala[:, :Price],
    # Voeg een label toe
    label="Onion and Wheat",
    # Kies balkkleur
    color=:darkseagreen1,

# Aantal bins bins=20, ) # Aslabels xlabel!("Price (Rupees)") ylabel!("Frequency")

Een histogram met de verdeling van uien- en tarweprijzen, met minder bins.

Introductie tot datavisualisatie met Julia

Aantal bins

# Teken een histogram
histogram(
    kerala[:, :Price],
    # Voeg een label toe
    label="Onion and Wheat",
    # Kies balkkleur
    color=:darkseagreen1,
    # Aantal bins
    bins=range(0, 150, 75),
)
# Aslabels
xlabel!("Price (Rupees)")
ylabel!("Frequency")

Een histogram met de verdeling van uien- en tarweprijzen, met meer bins.

Introductie tot datavisualisatie met Julia

Genormaliseerd histogram

# Teken een genormaliseerd histogram
histogram(
    kerala[:, :Price],
    # Voeg een label toe
    label="Onion and Wheat",
    # Kies balkkleur
    color=:darkseagreen1,

# Normaliseer normalize=true, ) # Aslabels xlabel!("Price (Rupees)") ylabel!("Probability")

Een genormaliseerd histogram met de verdeling van uien- en tarweprijzen.

Introductie tot datavisualisatie met Julia

Kansverdeling

using StatsPlots

density!( kerala[:, :Price], color=:black, linewidth=3, label=false )

Een histogram van uien- en tarweprijzen met daarover een dichtheidsplot die de kansverdeling toont.

Introductie tot datavisualisatie met Julia

Prijzen per product

using StatsPlots

# Gegroepeerd histogram
groupedhist(
    kerala[:, :Price],

# Groepeer op product group=kerala[:, "Commodity"],
# Kies kleuren color=[:deeppink3 :wheat2] ) xlabel!("Price (Rupees)") ylabel!("Frequency")

Een gegroepeerd histogram met uien- en tarweprijzen apart, met balken naast elkaar.

Introductie tot datavisualisatie met Julia

Gestapeld histogram

using StatsPlots

# Gestapeld histogram
groupedhist(
    kerala[:, :Price],
    # Groepeer op product
    group=kerala[:, "Commodity"],
    # Kies kleuren
    color=[:deeppink3 :wheat2]

# Stapel de balken bar_position=:stack, )
xlabel!("Price (Rupees)") ylabel!("Frequency")

Een gegroepeerd histogram met uien- en tarweprijzen apart, met balken op elkaar gestapeld.

Introductie tot datavisualisatie met Julia

Een subtiel verschil

Een gegroepeerd histogram met uien- en tarweprijzen apart, met balken op elkaar gestapeld.

  • De piekprijzen lijken erg vergelijkbaar.
Commodity Mean Price
Onion 25.7442
Wheat 20.6261
  • Uienprijzen hebben een lange staart.
  • Mediaanprijzen zijn bijna gelijk.
Commodity Median Price
Onion 20.0
Wheat 19.5
  • Het verschil in gemiddelden komt door de staart!
Introductie tot datavisualisatie met Julia

Laten we oefenen!

Introductie tot datavisualisatie met Julia

Preparing Video For Download...