Memplot dalam Lebih Banyak Dimensi

Pengantar Visualisasi Data dengan Julia

Gustavo Vieira Suñe

Data Analyst

Mengapa lebih banyak dimensi?

  • Kenali pola dan tren yang mendasari
  • Analisis hubungan banyak variabel sekaligus
  • Identifikasi klaster
  • Penyajian yang jelas dan imersif
  • Rekayasa fitur
Pengantar Visualisasi Data dengan Julia

Akankah klaster bertahan?

Plot sebar menunjukkan premi asuransi vs usia pemegang polis. Terlihat tiga klaster jelas.

  • Apakah klaster ini muncul untuk berapa pun jumlah anak?
Pengantar Visualisasi Data dengan Julia

Memplot irisan

theme(:bright)

# Saring data
no_children = filter(
    row -> row.Children == 0, insurance)

# Plot irisan @df no_children scatter( :Age, :Charges, group=:Smoker, markersize=4, alpha=0.5, legend_title="Smoker") xlabel!("Usia") ylabel!("Premi Asuransi (USD)")

Plot sebar menunjukkan premi asuransi vs usia pemegang polis tanpa anak. Terlihat tiga klaster jelas.

Pengantar Visualisasi Data dengan Julia

Menggunakan dimensi lain

theme(:bright)
@df insurance scatter(
    # Masukkan tiga kolom
    :Children,
    :Age,
    :Charges,

group=:Smoker, markersize=4, alpha=0.5, legend_title="Smoker" ) # Label sumbu xlabel!("Jumlah Anak") ylabel!("Usia") zlabel!("Premi Asuransi (USD)")

Plot sebar tiga dimensi menunjukkan premi asuransi vs usia dan jumlah anak pemegang polis. Struktur klaster sama terlihat pada titik dengan jumlah anak berbeda.

Pengantar Visualisasi Data dengan Julia

Urutan sumbu

theme(:bright)
@df insurance scatter(

# Tukar :Age dan :Children :Age, :Children, :Charges, group=:Smoker, markersize=4, alpha=0.5, legend_title="Smoker" ) # Label sumbu xlabel!("Jumlah Anak") ylabel!("Usia") zlabel!("Premi Asuransi (USD)")

Pengantar Visualisasi Data dengan Julia

Mengelompokkan menurut kategori lain

Plot sebar menunjukkan biaya asuransi vs indeks massa tubuh, dengan warna titik menurut status perokok.

  • Dapatkah kita mengelompokkan berdasarkan status perokok dan jenis kelamin?
Pengantar Visualisasi Data dengan Julia

Tambah dimensi kategorikal

theme(:vibrant)

@df insurance scatter(
    :BMI,

# Masukkan kolom kategorikal :Sex,
:Charges, group=:Smoker, markersize=2, legend_title="Smoker", color=[:blueviolet :goldenrod1]) xlabel!("BMI") zlabel!("Premi Asuransi (USD)")

Plot sebar tiga dimensi menunjukkan biaya asuransi vs indeks massa tubuh dan jenis kelamin, dengan warna titik menurut status perokok.

Pengantar Visualisasi Data dengan Julia

Visualisasikan kerapatan titik

Plot sebar menunjukkan biaya asuransi vs indeks massa tubuh, dengan warna titik menurut status perokok.

  • Bisakah kita memvisualisasikan kerapatan titik dengan lebih jelas?
Pengantar Visualisasi Data dengan Julia

Histogram dua dimensi

# Histogram 2D
@df insurance histogram2d(

:BMI, :Charges,
# Skema warna isian fillcolor=:acton,
# Isi bin kosong show_empty_bins=true,
) xlabel!("Usia") ylabel!("Premi Asuransi (USD)")

Histogram dua dimensi menampilkan distribusi biaya asuransi dan indeks massa tubuh.

Pengantar Visualisasi Data dengan Julia

Ayo berlatih!

Pengantar Visualisasi Data dengan Julia

Preparing Video For Download...