Geoms dışında istatistikler

ggplot2 ile Orta Düzey Veri Görselleştirme

Rick Scavetta

Founder, Scavetta Academy

Temel grafik

ggplot(iris, aes(x = Species, 
                 y = Sepal.Length)) +
  geom_jitter(width = 0.2)

ggplot2 ile Orta Düzey Veri Görselleştirme

İstatistik hesaplama

set.seed(123)
xx <- rnorm(100)
mean(xx)
[1] 0.09040591
mean(xx) + (sd(xx) * c(-1, 1))
[1] -0.822410  1.003222
ggplot2 ile Orta Düzey Veri Görselleştirme

İstatistik hesaplama

set.seed(123)
xx <- rnorm(100)

# Hmisc
library(Hmisc)
smean.sdl(xx, mult = 1)
       Mean       Lower       Upper 
 0.09040591 -0.82240997  1.00322179
# ggplot2
mean_sdl(xx, mult = 1)
           y     ymin     ymax
1 0.09040591 -0.82241 1.003222
ggplot2 ile Orta Düzey Veri Görselleştirme

stat_summary()

ggplot(iris, aes(x = Species, 
                 y = Sepal.Length)) +
 stat_summary(fun.data = mean_sdl, 
                fun.args = list(mult = 1))
  • Varsayılan olarak geom_pointrange() kullanır

ggplot2 ile Orta Düzey Veri Görselleştirme

stat_summary()

ggplot(iris, aes(x = Species, 
                 y = Sepal.Length)) +
  stat_summary(fun = mean,
               geom = "point") +
  stat_summary(fun.data = mean_sdl,
               fun.args = list(mult = 1),
               geom = "errorbar",
               width = 0.1)

ggplot2 ile Orta Düzey Veri Görselleştirme

Önerilmez!

ggplot2 ile Orta Düzey Veri Görselleştirme

%95 güven aralığı

ERR <- qt(0.975, length(xx) - 1) * (sd(xx) / sqrt(length(xx)))
mean(xx)
0.09040591
mean(xx) + (ERR * c(-1, 1)) # %95 GA
-0.09071657  0.27152838
mean_cl_normal(xx)
           y        ymin      ymax
0.09040591 -0.09071657 0.2715284
ggplot2 ile Orta Düzey Veri Görselleştirme

Diğer stat_ fonksiyonları

stat_ Açıklama
stat_summary() Ayrık x değerlerinde y’yi özetler.
stat_function() x’in bir fonksiyonundan y’yi hesaplar.
stat_qq() Q-Q grafiği hesaplamalarını yapar.
ggplot2 ile Orta Düzey Veri Görselleştirme

MASS::mammals

ggplot2 ile Orta Düzey Veri Görselleştirme

Normal dağılım

mam.new <- data.frame(body = log10(mammals$body))

ggplot(mam.new, aes(x = body)) + 
  geom_histogram(aes( y = ..density..)) +
  geom_rug() +
  stat_function(fun = dnorm, color = "red", 
                args = list(mean = mean(mam.new$body),
                            sd = sd(mam.new$body)))

ggplot2 ile Orta Düzey Veri Görselleştirme

QQ grafiği

ggplot(mam.new, aes(sample = body)) + 
  stat_qq() +
  geom_qq_line(col = "red")

ggplot2 ile Orta Düzey Veri Görselleştirme

Sıra sizde!

ggplot2 ile Orta Düzey Veri Görselleştirme

Preparing Video For Download...