Statistik: sum dan quantile

Visualisasi Data Tingkat Menengah dengan ggplot2

Rick Scavetta

Founder, Scavetta Academy

Ulasan dari kursus 1

Penyebab over-plotting Solusi
1. Dataset besar Alpha blending, lingkaran kosong, ukuran titik
2. Nilai sejajar pada satu sumbu Seperti di atas, plus ubah posisi
3. Data berpresisi rendah Posisi: jitter
4. Data bilangan bulat Posisi: jitter
Visualisasi Data Tingkat Menengah dengan ggplot2

Plot jumlah untuk atasi over-plotting

Penyebab over-plotting Solusi Di sini...
1. Dataset besar Alpha blending, lingkaran kosong, ukuran titik
2. Nilai sejajar pada satu sumbu Seperti di atas, plus ubah posisi
3. Data berpresisi rendah Posisi: jitter geom_count()
4. Data bilangan bulat Posisi: jitter geom_count()
Visualisasi Data Tingkat Menengah dengan ggplot2

Data presisi rendah (& bilangan bulat)

p <- ggplot(iris, aes(Sepal.Length, 
                      Sepal.Width))

p + geom_point()

Visualisasi Data Tingkat Menengah dengan ggplot2

Jitter bisa memberi kesan keliru

p + geom_jitter(alpha = 0.5,
                width = 0.1,
                height = 0.1)

Visualisasi Data Tingkat Menengah dengan ggplot2

geom_count()

p + 
  geom_count()

Visualisasi Data Tingkat Menengah dengan ggplot2

Kaitan geom/stat

geom_ stat_
geom_count() stat_sum()
Visualisasi Data Tingkat Menengah dengan ggplot2

stat_sum()

p + 
  stat_sum()

Visualisasi Data Tingkat Menengah dengan ggplot2

Over-plotting tetap bisa jadi masalah!

ggplot(iris, aes(Sepal.Length,
                 Sepal.Width, 
                 color = Species)) + 
  geom_count(alpha = 0.4)

Visualisasi Data Tingkat Menengah dengan ggplot2

geom_quantile()

ggplot(iris, aes(Sepal.Length,
                 Sepal.Width, 
                 color = Species)) + 
  geom_count(alpha = 0.4)
Visualisasi Data Tingkat Menengah dengan ggplot2

Mengatasi heteroskedastisitas

library(AER)
data(Journals)

p <- ggplot(Journals, 
            aes(log(price/citations), 
                log(subs))) +
  geom_point(alpha = 0.5) +
  labs(...)

p

Visualisasi Data Tingkat Menengah dengan ggplot2

Menggunakan geom_quantile

p +
  geom_quantile(quantiles = 
                c(0.05, 0.50, 0.95))

Visualisasi Data Tingkat Menengah dengan ggplot2

Kaitan geom/stat

geom_ stat_
geom_count() stat_sum()
geom_quantile() stat_quantile()
Visualisasi Data Tingkat Menengah dengan ggplot2

Siap untuk latihan!

Visualisasi Data Tingkat Menengah dengan ggplot2

Preparing Video For Download...