Estimator kerapatan kernel

Praktik Terbaik Visualisasi di R

Nick Strayer

Instructor

Saat histogram kewalahan

  • Data dengan banyak puncak kuat
  • Data kecil

Praktik Terbaik Visualisasi di R

Plot kerapatan kernel

  • Letakkan "kernel" di setiap titik data
  • Jumlahkan tinggi semua kernel yang tumpang tindih

Praktik Terbaik Visualisasi di R

Membuat KDE di ggplot

  • Cukup ganti geom_histogram() dengan geom_density()
sample_n(md_speeding, 100) %>%
  ggplot(aes(x = percentage_over_limit)) +
  # Ganti geom_histogram() 
    geom_density(
      # Isi kurva dengan warna
      fill = 'steelblue',
      # Simpangan baku kernel
      bw = 8 
    )
Praktik Terbaik Visualisasi di R

Praktik Terbaik Visualisasi di R

Lebar baru yang perlu diperhatikan

  • Perlu menyesuaikan simpangan baku kernel pada tiap titik

Praktik Terbaik Visualisasi di R

Praktik Terbaik Visualisasi di R

Tampilkan semua data

Gunakan geom_rug() untuk menampilkan semua data di bawah KDE dengan garis

p <-sample_n(md_speeding, 100) %>%
  ggplot(aes(x = percentage_over_limit)) +
  geom_density(
    fill = 'steelblue', # isi kurva dengan warna
    bw = 8 # simpangan baku kernel
  ) 

p + geom_rug(alpha = 0.4)
Praktik Terbaik Visualisasi di R

Praktik Terbaik Visualisasi di R

Mari menumpuk beberapa Gaussian!

Praktik Terbaik Visualisasi di R

Preparing Video For Download...