Beberapa plot dari DataFrame

Pengantar Visualisasi Data dengan Julia

Gustavo Vieira Suñe

Data Analyst

Beberapa variabel dalam satu plot

# Violin plot
@df insurance violin(
    :Sex, :Charges,
    label=false, linewidth=0,
    fillcolor=:grey40
)

# Tambahkan box plot @df insurance boxplot!( :Sex, :Charges, label=false, alpha=0.75, fillcolor=:mediumorchid3, outliers=false, ) ylabel!("Premi Asuransi (USD)")

Sebuah box plot dan violin plot ditumpuk menampilkan distribusi biaya asuransi menurut jenis kelamin.

Pengantar Visualisasi Data dengan Julia

Data kategorikal dan tata letak

  • DataFrame insurance
Age Sex BMI Children Smoker Region Charges
19 female 27.90 0 yes southwest 16884.90
18 male 33.77 1 no southeast 1725.55
28 male 33.00 3 no southeast 4449.46
... ... ... ... ... ... ...
  • Kolom kategorikal → visualisasi plot berdampingan
    • Resep @df kompatibel dengan argumen layout!
Pengantar Visualisasi Data dengan Julia

Tata letak dengan DataFrame

@df insurance violin(
    :Sex,
    :Charges,
    group=:Region,
    linewidth=0,
    color=[:red :green :blue :purple],
    legend_position=:top,

# Atur tata letak layout=(2,2)
) ylims!(0, 6*10^4) ylabel!("Premi (USD)")

Kisi 2x2 box plot yang menampilkan distribusi biaya asuransi menurut jenis kelamin untuk tiap wilayah.

Pengantar Visualisasi Data dengan Julia

Menambahkan chain ke dalamnya

@chain insurance begin
    # Kolom Smoker ke numerik
    transform(:Smoker
        => ByRow(x -> x == "yes" ? 100 : 0)
        => :Smoker)

groupby([:Sex, :Children]) combine(:Smoker => mean)
@df bar(:Children, :Smoker_mean, group=:Sex, linewidth=0, fillcolor=[:cyan4 :chocolate2], # Atur tata letak layout=2)
end ylims!(0, 35) xlabel!("Children") ylabel!("Persentase Perokok")

Kisi 1x2 diagram batang yang menampilkan persentase perokok terhadap jumlah anak.

Pengantar Visualisasi Data dengan Julia

Plot matriks korelasi

Kisi 2x2 plot. Plot diagonal menampilkan histogram sebaran usia dan indeks massa tubuh. Plot di atas diagonal utama menunjukkan histogram dua dimensi usia vs BMI, dan plot di bawah diagonal menampilkan sebaran titik variabel yang sama.

Pengantar Visualisasi Data dengan Julia

Plot matriks korelasi

Kisi 2x2 plot. Plot diagonal menampilkan histogram sebaran usia dan indeks massa tubuh. Plot di atas diagonal utama menunjukkan histogram dua dimensi usia vs BMI, dan plot di bawah diagonal menampilkan sebaran titik variabel yang sama.

  • Diagonal

    • Histogram distribusi variabel
  • Di atas diagonal

    • Histogram dua dimensi
  • Di bawah diagonal

    • Scatter plot dengan garis regresi
Pengantar Visualisasi Data dengan Julia

Plot matriks korelasi di StatsPlots.jl

# Menggunakan resep DataFrames
@df insurance corrplot(

# Kolom numerik [:Age :BMI],
# Kustomisasi markercolor=:thermal, fillcolor=:acton )

Kisi 2x2 plot. Plot diagonal menampilkan histogram sebaran usia dan indeks massa tubuh. Plot di atas diagonal utama menunjukkan histogram dua dimensi usia vs BMI, dan plot di bawah diagonal menampilkan sebaran titik variabel yang sama.

1 https://docs.juliaplots.org/latest/generated/colorschemes/
Pengantar Visualisasi Data dengan Julia

Plot matriks korelasi di StatsPlots.jl

# Menggunakan resep DataFrames
@df insurance corrplot(
    # Kolom numerik
    [:Age :BMI :Children :Charges],

# Kustomisasi markercolor=:thermal, fillcolor=:acton )

Plot matriks korelasi untuk usia, BMI, jumlah anak, dan biaya asuransi.

Pengantar Visualisasi Data dengan Julia

Ayo berlatih!

Pengantar Visualisasi Data dengan Julia

Preparing Video For Download...