Distribusi: bagian satu

Praktik Terbaik Visualisasi di R

Nick Strayer

Instructor

Apa itu data distribusi?

  • Banyak “observasi”
  • Biasanya sampel dari suatu populasi

Praktik Terbaik Visualisasi di R

Mengapa distribusi penting

  • Kesalahan pengumpulan/pembersihan data bisa terlihat
  • Bisa menandakan perlu mengontrol variabel dalam model
  • Setia pada data

Praktik Terbaik Visualisasi di R

Plot standar

Histogram

  • Cocok untuk satu distribusi
  • Bab ini

boxplot

  • Untuk membandingkan banyak distribusi
  • Bab berikutnya

Praktik Terbaik Visualisasi di R

Data pelanggaran kecepatan Maryland

md_speeding

Praktik Terbaik Visualisasi di R

Membuat histogram di ggplot2

  • geom_histogram()
  • Otomatis membuat bin data
  • Cukup berikan x aesthetic
md_speeding %>% 
  filter(vehicle_color == 'BLUE') %>% 
  ggplot(aes(x = speed)) +
  geom_histogram()
Praktik Terbaik Visualisasi di R

Praktik Terbaik Visualisasi di R

Ayo buat beberapa histogram!

Praktik Terbaik Visualisasi di R

Preparing Video For Download...