Genel Sosyal Araştırma

R ile Kategorik Verilerde Çıkarım

Andrew Bray

Assistant Professor of Statistics at Reed College

ex-1-1 copy.002.png

R ile Kategorik Verilerde Çıkarım

ex-1-1 copy.003.png

R ile Kategorik Verilerde Çıkarım

ex-1-1 copy.004.png

R ile Kategorik Verilerde Çıkarım

ex-1-1 copy.005.png

R ile Kategorik Verilerde Çıkarım

ex-1-1 copy.006.png

R ile Kategorik Verilerde Çıkarım

GSS’yi Keşfetme

library(dplyr)
glimpse(gss)
Gözlem: 3.300
Değişken: 25
$ id       <dbl> 518, 1092, 2094, 229, 979, 554, 491, 319, 3143, 1...
$ year     <dbl> 1982, 1982, 1982, 1982, 1982, 1982, 1982, 1982, 1...
$ age      <fct> 49, 22, 26, 75, 71, 33, 56, 33, 69, 40, 44, 42, 5...
$ class    <fct> İŞÇİ SINIFI, İŞÇİ SINIFI, İŞÇİ SINIFI, ALT, ...
$ degree   <fct> LİSE, LİSE, LİSE, LİSEDEN DÜŞÜK, ...
$ sex      <fct> ERKEK, ERKEK, ERKEK, ERKEK, KADIN, KADIN, ERKEK, KAD...
$ happy    <fct> MUTLU, MUTLU, MUTLU, MUTLU, MUTLU, MUTLU, MUTLU, ...
R ile Kategorik Verilerde Çıkarım

GSS’yi Keşfetme

gss2016 <- filter(gss, year == 2016)
ggplot(gss2016, aes(x = happy)) +
  geom_bar()

ch1v1-happy-barplot-a.png

R ile Kategorik Verilerde Çıkarım

GSS’yi Keşfetme

gss2016 <- filter(gss, year == 2016)
ggplot(gss2016, aes(x = happy)) +
  geom_bar()

ch1v1-happy-barplot-b.png

R ile Kategorik Verilerde Çıkarım

GSS’yi Keşfetme

p_hat <- gss2016 %>%
  summarize(prop_happy = mean(happy == "HAPPY")) %>%
  pull()
p_hat
0.7733333
R ile Kategorik Verilerde Çıkarım

Genel %95 güven aralığı

$$(\hat{p} - 2 \times SE, \hat{p} + 2 \times SE)$$

Örneklem oranı ± iki standart hata

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.016.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.017.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.018.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.019.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.020.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.021.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.022.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.023.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.024.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.025.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.026.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.027.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.028.png

R ile Kategorik Verilerde Çıkarım

Bootstrap

ex-1-1 copy.029.png

R ile Kategorik Verilerde Çıkarım

Bootstrap Güven Aralığı

library(infer)
boot <- gss2016 %>%
  specify(response = happy, 
          success = “HAPPY”) %>%
  generate(reps = 500, 
           type = "bootstrap") %>%
  calculate(stat = "prop")
boot
Yanıt: happy (faktör)
# A tibble: 500 x 2
   replicate  stat
       <int> <dbl>
 1         1 0.827
 2         2 0.740
 3         3 0.780
 4         4 0.773
 5         5 0.747
 6         6 0.753
R ile Kategorik Verilerde Çıkarım

Bootstrap Güven Aralığı

ggplot(boot, aes(x = stat)) +
  geom_density()

ch1v1-happy-densityplot.png

R ile Kategorik Verilerde Çıkarım

Bootstrap Güven Aralığı

SE <- boot %>%
  summarize(sd(stat)) %>%
  pull()
SE
0.03482251

$$(\hat{p} - 2 \times SE, \hat{p} + 2 \times SE)$$

c(p_hat - 2 * SE, p_hat + 2 * SE)
0.7051883 0.8412784
R ile Kategorik Verilerde Çıkarım

Haydi pratik yapalım!

R ile Kategorik Verilerde Çıkarım

Preparing Video For Download...