t統計量からp値を計算する

Rによる仮説検定

Richie Cotton

Data Evangelist at DataCamp

t分布

標準正規分布のPDFと自由度1のt分布の比較グラフ。t分布は裾が太く、中央のピークが低い。

標準正規分布のPDFと各種自由度のt分布の比較グラフ。自由度が増えると裾が細くなり、ピークが高くなり、正規分布に近づく。

$H_{0}$：子ども期に初めてコーディングした人と大人になってから初めてコーディングした人で、平均報酬（USD）は同じ。

$H_{A}$：子ども期に初めてコーディングした人の平均報酬（USD）は、大人で初めての人より大きい。

右片側検定を用いる。

$\alpha = 0.1$

もし $p \le \alpha$ なら $H_{0}$ を棄却。

p_value <- pnorm(z_score, lower.tail = FALSE)

numerator <- xbar_child - xbar_adult
denominator <- sqrt(s_child ^ 2 / n_child + s_adult ^ 2 / n_adult)
t_stat <- numerator / denominator

2.4046

degrees_of_freedom <- n_child + n_adult - 2

p_value <- pt(t_stat, df = degrees_of_freedom, lower.tail = FALSE)

0.008130

Rによる仮説検定