Galat baku dan Teorema Limit Pusat

Sampling di R

Richie Cotton

Data Evangelist at DataCamp

Distribusi penarikan sampel rataan poin cangkir

Histogram distribusi penarikan sampel aproksimasi dari rataan poin cangkir dengan ukuran sampel lima.

Histogram distribusi penarikan sampel aproksimasi dari rataan poin cangkir dengan ukuran sampel 20.

Histogram distribusi penarikan sampel aproksimasi dari rataan poin cangkir dengan ukuran sampel 80.

Histogram distribusi penarikan sampel aproksimasi dari rataan poin cangkir dengan ukuran sampel 320.

Sampling di R

Konsekuensi teorema limit pusat

  • Rataan dari sampel independen berdistribusi mendekati normal.

Seiring ukuran sampel membesar,

  • distribusi rataan makin mendekati normal, dan

  • lebar distribusi penarikan sampel makin sempit.

Sampling di R

Rataan populasi & distribusi penarikan sampel

coffee_ratings %>%
  summarize(
    mean_cup_points = mean(total_cup_points)
  ) %>% 
  pull(mean_cup_points)
82.1512
Ukuran sampel Rataan rataan sampel
5 82.1496
20 82.1610
80 82.1496
320 82.1521
Sampling di R

Simpangan baku populasi & distribusi penarikan sampel

coffee_ratings %>%
  summarize(
    sd_cup_points = sd(total_cup_points)
  ) %>%
  pull(sd_cup_points)
2.68686
Ukuran sampel SD rataan sampel
5 1.1929
20 0.6028
80 0.2865
320 0.1304
Sampling di R

SD populasi dibagi akar ukuran sampel

Ukuran sampel SD rataan sampel Perhitungan Hasil
5 1.1929 2.68686 / sqrt(5) 1.2016
20 0.6028 2.68686 / sqrt(20) 0.6008
80 0.2865 2.68686 / sqrt(80) 0.3004
320 0.1304 2.68686 / sqrt(320) 0.1502
Sampling di R

Ayo berlatih!

Sampling di R

Preparing Video For Download...