Güven aralıkları

R'de Örnekleme

Richie Cotton

Data Evangelist at DataCamp

Güven aralıkları

  • "Ortalamanın bir standart sapması içindeki değerler" bu dağılımların her birinde çok sayıda değeri kapsar.
  • Bununla ilişkili bir kavramı tanımlayacağız: bir güven aralığı.
R'de Örnekleme

Hava durumunu tahmin etme

  • Amerika Birleşik Devletleri'nde South Dakota, Rapid City en öngörülemez havaya sahiptir.
  • Göreviniz, yarın oradaki en yüksek sıcaklığı tahmin etmektir.

Havanın haritası; renkler bölgelerin ne kadar öngörülebilir olduğunu gösterir.

R'de Örnekleme

Hava tahmininiz

  • nokta tahmini = 47 °F (8,3 °C)
  • makul en yüksek sıcaklık aralığı = 40–54 °F (4,4–12,8 °C)
R'de Örnekleme

Az önce bir güven aralığı bildirdiniz

  • 40–54 °F bir güven aralığıdır
  • Bazen 47 °F (40 °F, 54 °F) ya da 47 °F [40 °F, 54 °F] olarak yazılır
  • ... veya 47 ± 7 °F
  • 7 °F, hata payıdır
R'de Örnekleme

Ortalama lezzetin bootstrap dağılımı

ggplot(coffee_boot_distn, aes(resample_mean)) +
  geom_histogram(binwidth = 0.002)

Ortalama kahve lezzetinin histogramı.

R'de Örnekleme

Yeniden örneklemelerin ortalaması

coffee_boot_distn %>% 
  summarize(
    mean_resample_mean = mean(resample_mean)
  )
# A tibble: 1 x 1
  mean_resample_mean
               <dbl>
1             7.5263

Ortalama kahve lezzeti histogramı; ortalama dikey mavi çubukla gösterilmiş.

R'de Örnekleme

Ortalama ± bir standart sapma

coffee_boot_distn %>% 
  summarize(
    mean_resample_mean = mean(resample_mean),
    mean_minus_1sd = mean_resample_mean - sd(resample_mean),
    mean_plus_1sd = mean_resample_mean + sd(resample_mean)
  )
# A tibble: 1 x 3
  mean_resample_mean mean_plus_1sd mean_minus_1sd
               <dbl>         <dbl>          <dbl>
1             7.5263        7.5355         7.5171

Kahve lezzeti ortalamalarının histogramı; ortalama ve standart sapmalar dikey çubuklarla gösterilmiş.

R'de Örnekleme

Güven aralığı için çeyrek (quantile) yöntemi

coffee_boot_distn %>% 
  summarize(
    lower = quantile(resample_mean, 0.025),
    upper = quantile(resample_mean, 0.975)
  )
# A tibble: 1 x 2
   lower  upper
   <dbl>  <dbl>
1 7.5087 7.5447

%95 güven aralığı çizgisi.

R'de Örnekleme

Ters kümülatif dağılım fonksiyonu

  • PDF: Çan eğrisi
  • CDF: çan eğrisi altında alanı elde etmek için tümle
  • Ters CDF: x ve y eksenlerini çevir
normal_inv_cdf <- tibble(
  p = seq(-0.001, 0.999, 0.001),
  inv_cdf = qnorm(p)
)
ggplot(normal_inv_cdf, aes(p, inv_cdf)) +
  geom_line()

Ters kümülatif dağılım fonksiyonu.

1 Bkz. "Introduction to Statistics in R", Bölüm 3, "Normal Dağılım"
R'de Örnekleme

Güven aralığı için standart hata yöntemi

coffee_boot_distn %>% 
  summarize(
    point_estimate = mean(resample_mean),
    std_error = sd(resample_mean),

lower = qnorm(0.025, point_estimate, std_error), upper = qnorm(0.975, point_estimate, std_error)
)
# A tibble: 1 x 4
  point_estimate std_error  lower  upper
           <dbl>     <dbl>  <dbl>  <dbl>
1         7.5263 0.0091815 7.5083 7.5443
R'de Örnekleme

Vamos praticar!

R'de Örnekleme

Preparing Video For Download...