Pengantar membandingkan distribusi

Praktik Terbaik Visualisasi di R

Nick Strayer

Instructor

Mengapa membandingkan distribusi?

  • Verifikasi kelompok seimbang
  • Untuk keperluan perbandingan

Praktik Terbaik Visualisasi di R

Mengapa tidak gunakan faceting pada histogram?

ggplot(md_speeding, aes(x = speed_over)) + 
  geom_histogram() +
  facet_grid(vehicle_color ~ .)

Praktik Terbaik Visualisasi di R

Boxplot

 

Praktik Terbaik Visualisasi di R

Kelebihan boxplot

  • Familiar
  • Banyak ringkasan statistik yang baik

Praktik Terbaik Visualisasi di R

Kekurangan boxplot

  • Tampilkan datanya!

Praktik Terbaik Visualisasi di R

Penambahan sederhana

  • geom_jitter() menampilkan titik mentah yang digeser agar tidak tumpang tindih.
  • Letakkan di bawah geom_boxplot().
md_speeding %>% 
  filter(vehicle_color == 'BLUE') %>%
  ggplot(aes(x = gender, y = speed)) +
    # Gambar titik di belakang 
    geom_jitter(alpha = 0.3, color = 'steelblue') + 
    # Buat transparan
    geom_boxplot(alpha = 0) + 
    labs(title = 'Distribusi kecepatan mobil biru menurut gender')
Praktik Terbaik Visualisasi di R

Praktik Terbaik Visualisasi di R

Mari bandingkan beberapa distribusi!

Praktik Terbaik Visualisasi di R

Preparing Video For Download...