Menghitung p-value dari t-statistik

Pengujian Hipotesis di R

Richie Cotton

Data Evangelist at DataCamp

Sebaran t

  • Statistik uji t mengikuti sebaran t.
  • Sebaran t memiliki parameter bernama derajat bebas (df).
  • Bentuknya mirip normal, dengan ekor lebih tebal.

Grafik yang menampilkan PDF normal baku dibandingkan sebaran t dengan 1 derajat bebas. Sebaran t berekor lebih tebal dan puncaknya lebih rendah.

Pengujian Hipotesis di R

Derajat bebas

  • Saat derajat bebas meningkat, sebaran t mendekati normal.
  • Sebaran normal adalah sebaran t dengan derajat bebas tak hingga.
  • Derajat bebas adalah jumlah maksimum nilai yang saling bebas dalam sampel.

Grafik yang menampilkan PDF normal baku dibandingkan sebaran t dengan berbagai derajat bebas. Saat derajat bebas naik, ekor menyempit dan puncak meninggi, semakin mirip normal.

Pengujian Hipotesis di R

Menghitung derajat bebas

  • Misalkan dataset Anda memiliki 5 observasi independen.
  • Empat nilainya adalah 2, 6, 8, dan 5.
  • Rata-rata sampel juga diketahui 5.
  • Nilai terakhir tidak lagi bebas; harus 4.
  • Terdapat 4 derajat bebas.
  • $df = n_{child} + n_{adult} - 2$
Pengujian Hipotesis di R

Hipotesis

$H_{0}$: Rata-rata kompensasi (USD) sama untuk yang pertama kali ngoding saat anak vs saat dewasa.

$H_{A}$: Rata-rata kompensasi (USD) lebih besar untuk yang pertama kali ngoding saat anak dibanding saat dewasa.

 

Gunakan uji sisi kanan.

Pengujian Hipotesis di R

Taraf signifikansi

$\alpha = 0.1$

Jika $p \le \alpha$ maka tolak $H_{0}$.

Pengujian Hipotesis di R

Menghitung p-value: satu proporsi vs. sebuah nilai

p_value <- pnorm(z_score, lower.tail = FALSE)
Pengujian Hipotesis di R

Menghitung p-value: dua mean dari grup berbeda

numerator <- xbar_child - xbar_adult
denominator <- sqrt(s_child ^ 2 / n_child + s_adult ^ 2 / n_adult)
t_stat <- numerator / denominator
2.4046
degrees_of_freedom <- n_child + n_adult - 2
2578
  • Standard error statistik uji menggunakan pendekatan (bukan bootstrap).
  • Gunakan CDF sebaran t, bukan CDF normal.
p_value <- pt(t_stat, df = degrees_of_freedom, lower.tail = FALSE)
0.008130
Pengujian Hipotesis di R

Ayo berlatih!

Pengujian Hipotesis di R

Preparing Video For Download...