Distribusi teracak

Dasar-dasar Inferensi di R

Jo Hardin

Instructor

Logika inferensi

ch1_2_v2_infer.002.png

Logika inferensi

ch1_2_v2_infer.003.png

Logika inferensi

ch1_2_v2_infer.004.png

Logika inferensi

ch1_2_v2_infer.005.png

Logika inferensi

ch1_2_v2_infer.006.png

Logika inferensi

Memahami distribusi nol

Membuat distribusi statistik dari populasi nol memberi informasi apakah data teramati tidak konsisten dengan hipotesis nol

Memahami distribusi nol

Data asli

Lokasi	Cola	Jeruk
Timur	28	6
Barat	19	7

$\hat{p}_\text{east} = 28/(28 + 6) = 0.82$

$\hat{p}_\text{west} = 19/(19 + 7) = 0.73$

Memahami distribusi nol

Pengacakan pertama, sama seperti asli

Lokasi	Cola	Jeruk
Timur	28	6
Barat	19	7

ch1_2_v2_infer.017.png

Memahami distribusi nol

Pengacakan kedua

Lokasi	Cola	Jeruk
Timur	27	7
Barat	20	6

ch1_2_v2_infer.019.png

Memahami distribusi nol

Pengacakan ketiga

Lokasi	Cola	Jeruk
Timur	28	8
Barat	21	5

ch1_2_v2_infer.020.png

Memahami distribusi nol

Pengacakan keempat

Lokasi	Cola	Jeruk
Timur	25	9
Barat	22	4

ch1_2_v2_infer.021.png

Memahami distribusi nol

Pengacakan kelima

Lokasi	Cola	Jeruk
Timur	29	5
Barat	18	8

ch1_2_v2_infer.022.png

Memahami distribusi nol

Pengacakan kelima

Lokasi	Cola	Jeruk
Timur	29	5
Barat	18	8

ch1_2_v2_infer.023.png

Memahami distribusi nol

ch1_2_v2_infer.024.png

Memahami distribusi nol

ch1_2_v2_infer.025.png

Memahami distribusi nol

ch1_2_v2_infer.026.png

Memahami distribusi nol

ch1_2_v2_infer.027.png

Memahami distribusi nol

ch1_2_v2_infer.028.png

Memahami distribusi nol

ch1_2_v2_infer.029.png

Satu permutasi acak

soda %>%
group_by(location) %>%
summarize(prop_cola = 
    mean(drink == "cola")) %>%
summarize(diff(prop_cola))

# A tibble: 1 x 1
  `diff(prop_cola)`
              <dbl>
1        -0.09276018

library(infer)
soda %>% specify(drink ~ location,
                success = "cola") %>%
hypothesize(null = "independence") %>%
generate(reps = 1, type = "permute") %>%
calculate(stat = "diff in props", 
            order = c("west","east"))

# A tibble: 1 x 2
  replicate        stat
      <int>        <dbl>
1        1    -0.02488688

Banyak permutasi acak

soda %>%
  specify(drink ~ location, success = "cola") %>%
  hypothesize(null = "independence") %>%
  generate(reps = 5, type = "permute") %>%
  calculate(stat = "diff in props", order = c("west", "east"))

# A tibble: 5 x 2
  replicate        stat
      <int>       <dbl>
1         1  0.04298643
2         2 -0.09276018
3         3  0.11085973
4         4  0.17873303
5         5 -0.16063348

Distribusi acak

ch1_2_v2_infer.047.png

Ayo berlatih!

Dasar-dasar Inferensi di R