Memplot data dalam DataFrame

Pengantar Visualisasi Data dengan Julia

Gustavo Vieira Suñe

Data Analyst

Dataset Insurance

  • DataFrame insurance
Age Sex BMI Children Smoker Region Charges
19 female 27.90 0 yes southwest 16884.90
18 male 33.77 1 no southeast 1725.55
28 male 33.00 3 no southeast 4449.46
... ... ... ... ... ... ...

 

  • DataFrame fleksibel dan efisien untuk data tabel
    • StatsPlots punya resep untuk memplot data dalam DataFrame
    • Perkenalkan notasi @df!
Pengantar Visualisasi Data dengan Julia

Mengekstrak array dari DataFrame

  • Rata-rata biaya per wilayah dan status perokok
# Kelompokkan per wilayah dan perokok
grouped = groupby(insurance, [:Region, :Smoker])

# Hitung biaya rata-rata grouped_mean_charges = combine(grouped, :Charges => mean)
  • Tiap kolom memberi array data
    • Contoh: grouped_mean_charges.Region mengekstrak array berisi wilayah sebagai string.
Pengantar Visualisasi Data dengan Julia

Memplot data dalam array

# Diagram batang berkelompok
groupedbar(

# Beri array sebagai argumen grouped_mean_charges.Region, grouped_mean_charges.Charges_mean, group=grouped_mean_charges.Smoker,
color=[:teal :orangered2], linewidth=0, legend_title="Smoker", legend_position=:outertopright) xlabel!("Region") ylabel!("Insurance Premium (USD)")

Diagram batang berkelompok yang menampilkan biaya premi asuransi per wilayah menurut status perokok.

Pengantar Visualisasi Data dengan Julia

Memplot langsung dari DataFrame

# Plot dari DataFrame
@df grouped_mean_charges groupedbar(

# Beri nama kolom :Region, :Charges_mean,
group=:Smoker,
color=[:teal :orangered2], linewidth=0, legend_title="Smoker", legend_position=:outertopright) xlabel!("Region") ylabel!("Insurance Premium (USD)")

Diagram batang berkelompok yang menampilkan biaya premi asuransi per wilayah menurut status perokok.

Pengantar Visualisasi Data dengan Julia

Perbandingan berdampingan

# Diagram batang berkelompok
groupedbar(

# Beri array sebagai argumen grouped_mean_charges.Region, grouped_mean_charges.Charges_mean, group=grouped_mean_charges.Smoker,
color=[:teal :orangered2], linewidth=0, legend_title="Smoker", legend_position=:outertopright) xlabel!("Region") ylabel!("Insurance Premium (USD)")
# Plot dari DataFrame
@df grouped_mean_charges groupedbar(

# Beri nama kolom :Region, :Charges_mean, group=:Smoker,
color=[:teal :orangered2], linewidth=0, legend_title="Smoker", legend_position=:outertopright) xlabel!("Region") ylabel!("Insurance Premium (USD)")
Pengantar Visualisasi Data dengan Julia

Merantai perintah DataFrame

  • Dari sebelumnya

    # Kelompokkan per wilayah dan perokok
    grouped = groupby(insurance, [:Region, :Smoker])
    # Hitung biaya rata-rata
    grouped_mean_charges = combine(grouped, :Charges => mean)
    
  • Gunakan chaining sebagai gantinya

    using Chain
    # Rantai groupby dan combine
    grouped_mean_charges = @chain insurance begin
      groupby([:Region, :Smoker])
      combine(:Charges => mean)
    end
    
Pengantar Visualisasi Data dengan Julia

Rantai plotting

# Rantai plotting
@chain insurance begin
    # Olah data
    groupby([:Region, :Smoker])
    combine(:Charges => mean)

# Plot data @df groupedbar(:Region, :Charges_mean, group=:Smoker, color=[:teal :orangered2], linewidth=0, legend_title="Smoker", legend_position=:outertopright)
end xlabel!("Region") ylabel!("Insurance Premium (USD)")

Diagram batang berkelompok yang menampilkan biaya premi asuransi per wilayah menurut status perokok.

Pengantar Visualisasi Data dengan Julia

Ayo berlatih!

Pengantar Visualisasi Data dengan Julia

Preparing Video For Download...