t-istatistiklerinden p-değerleri hesaplama

R ile Hipotez Testi

Richie Cotton

Data Evangelist at DataCamp

t-dağılımları

  • Test istatistiği t, t-dağılımını izler.
  • t-dağılımlarının serbestlik derecesi (df) adlı bir parametresi vardır.
  • t-dağılımları, daha kalın kuyruklu normal dağılımlara benzer.

Standart normal dağılımın PDF’si ile 1 serbestlik dereceli t-dağılımının karşılaştırıldığı grafik. t-dağılımının kuyrukları daha kalın ve ortadaki tepe daha basıktır.

R ile Hipotez Testi

Serbestlik derecesi

  • Serbestlik derecesi arttıkça, t-dağılımı normal dağılıma yaklaşır.
  • Normal dağılım, sonsuz serbestlik dereceli bir t-dağılımıdır.
  • Serbestlik derecesi, örnekteki mantıksal olarak bağımsız değerlerin en yüksek sayısıdır.

Standart normal dağılımın PDF’si ile çeşitli serbestlik derecelerine sahip t-dağılımının karşılaştırıldığı grafik. Serbestlik derecesi arttıkça kuyruklar daralır, tepe yükselir ve normal dağılıma daha çok benzer.

R ile Hipotez Testi

Serbestlik derecesi hesaplama

  • Diyelim ki veri setinizde 5 bağımsız gözlem var.
  • Dört değer 2, 6, 8 ve 5’tir.
  • Örnek ortalamasının 5 olduğunu da biliyorsunuz.
  • Son değer artık bağımsız değildir; 4 olmalıdır.
  • Serbestlik derecesi 4’tür.
  • $df = n_{child} + n_{adult} - 2$
R ile Hipotez Testi

Hipotezler

$H_{0}$: USD cinsinden ortalama ücret, ilk kez çocukken kodlayanlar ile ilk kez yetişkinken kodlayanlar için aynıdır.

$H_{A}$: USD cinsinden ortalama ücret, ilk kez çocukken kodlayanlar için ilk kez yetişkinken kodlayanlara göre daha yüksektir.

 

Sağ kuyruklu bir test kullanın.

R ile Hipotez Testi

Anlamlılık düzeyi

$\alpha = 0.1$

Eğer $p \le \alpha$ ise $H_{0}$ reddedilir.

R ile Hipotez Testi

p-değeri hesaplama: bir oranın bir değerle karşılaştırılması

p_value <- pnorm(z_score, lower.tail = FALSE)
R ile Hipotez Testi

p-değeri hesaplama: farklı iki grubun ortalamaları

numerator <- xbar_child - xbar_adult
denominator <- sqrt(s_child ^ 2 / n_child + s_adult ^ 2 / n_adult)
t_stat <- numerator / denominator
2.4046
degrees_of_freedom <- n_child + n_adult - 2
2578
  • Test istatistiğinin standart hatası yaklaşıklandı (bootstrap yok).
  • Normal CDF değil t-dağılımı CDF kullanılmalıdır.
p_value <- pt(t_stat, df = degrees_of_freedom, lower.tail = FALSE)
0.008130
R ile Hipotez Testi

Hadi pratik yapalım!

R ile Hipotez Testi

Preparing Video For Download...