Memvisualisasikan distribusi

Pengantar Visualisasi Data dengan Julia

Gustavo Vieira Suñe

Data Analyst

Harga bawang dan gandum di Kerala, India

  • DataFrame kerala:
Date Centre Commodity Price
JAN-2001 Ernakulam Onion 10.0
JAN-2001 Ernakulam Wheat 12.5
JAN-2001 Khozhikode Onion 9.0
JAN-2001 Khozhikode Wheat 14.0
... ... ... ...
MAR-2021 Trivandrum Onion 45.0
MAR-2021 Trivandrum Wheat 34.0
  • Seberapa berbeda harga bawang dan gandum?
Commodity Mean Price
Onion 25.7442
Wheat 20.6261
Pengantar Visualisasi Data dengan Julia

Memvisualisasikan distribusi dengan histogram

Histogram yang menampilkan distribusi harga bawang dan gandum.

Pengantar Visualisasi Data dengan Julia

Distribusi harga bawang dan gandum

# Plot a histogram
histogram(
    kerala[:, :Price],

# Add a label label="Onion and Wheat", # Choose bar color color=:darkseagreen1, )
# Add axis labels xlabel!("Price (Rupees)") ylabel!("Frequency")

Histogram yang menampilkan distribusi harga bawang dan gandum.

Pengantar Visualisasi Data dengan Julia

Jumlah bin

# Plot a histogram
histogram(
    kerala[:, :Price],
    # Add a label
    label="Onion and Wheat",
    # Choose bar color
    color=:darkseagreen1,

# Number of bins bins=20, ) # Add axis labels xlabel!("Price (Rupees)") ylabel!("Frequency")

Histogram yang menampilkan distribusi harga bawang dan gandum, dengan jumlah bin lebih sedikit.

Pengantar Visualisasi Data dengan Julia

Jumlah bin

# Plot a histogram
histogram(
    kerala[:, :Price],
    # Add a label
    label="Onion and Wheat",
    # Choose bar color
    color=:darkseagreen1,
    # Number of bins
    bins=range(0, 150, 75),
)
# Add axis labels
xlabel!("Price (Rupees)")
ylabel!("Frequency")

Histogram yang menampilkan distribusi harga bawang dan gandum, dengan jumlah bin lebih banyak.

Pengantar Visualisasi Data dengan Julia

Histogram ternormalisasi

# Plot a normalized histogram
histogram(
    kerala[:, :Price],
    # Add a label
    label="Onion and Wheat",
    # Choose bar color
    color=:darkseagreen1,

# Normalize it normalize=true, ) # Add axis labels xlabel!("Price (Rupees)") ylabel!("Probability")

Histogram ternormalisasi yang menampilkan distribusi harga bawang dan gandum.

Pengantar Visualisasi Data dengan Julia

Distribusi probabilitas

using StatsPlots

density!( kerala[:, :Price], color=:black, linewidth=3, label=false )

Histogram harga bawang dan gandum dengan plot densitas di atasnya yang menunjukkan distribusi probabilitas.

Pengantar Visualisasi Data dengan Julia

Harga per komoditas

using StatsPlots

# Grouped histogram
groupedhist(
    kerala[:, :Price],

# Group by commodity group=kerala[:, "Commodity"],
# Select colors color=[:deeppink3 :wheat2] ) xlabel!("Price (Rupees)") ylabel!("Frequency")

Histogram berkelompok yang menampilkan harga bawang dan gandum secara terpisah dengan batang berdampingan.

Pengantar Visualisasi Data dengan Julia

Histogram bertumpuk

using StatsPlots

# Stacked histogram
groupedhist(
    kerala[:, :Price],
    # Group by commodity
    group=kerala[:, "Commodity"],
    # Select colors
    color=[:deeppink3 :wheat2]

# Stack the bars bar_position=:stack, )
xlabel!("Price (Rupees)") ylabel!("Frequency")

Histogram berkelompok yang menampilkan harga bawang dan gandum secara terpisah dengan batang ditumpuk.

Pengantar Visualisasi Data dengan Julia

Perbedaan halus

Histogram berkelompok yang menampilkan harga bawang dan gandum secara terpisah dengan batang ditumpuk.

  • Puncak harga tampak sangat mirip.
Commodity Mean Price
Onion 25.7442
Wheat 20.6261
  • Harga bawang punya ekor panjang.
  • Median hampir sama.
Commodity Median Price
Onion 20.0
Wheat 19.5
  • Selisih mean disebabkan oleh ekor!
Pengantar Visualisasi Data dengan Julia

Ayo berlatih!

Pengantar Visualisasi Data dengan Julia

Preparing Video For Download...