Signifikansi statistik

Pengujian Hipotesis di R

Richie Cotton

Data Evangelist at DataCamp

Ringkasan p-value

  • p-value mengukur bukti untuk hipotesis nol.
  • p-value besar → gagal menolak hipotesis nol.
  • p-value kecil → tolak hipotesis nol.
  • Di mana titik batasnya?
Pengujian Hipotesis di R

Taraf signifikansi

Taraf signifikansi uji hipotesis ($\alpha$) adalah ambang untuk "melampaui keraguan wajar".

  • Nilai umum $\alpha$: 0.1, 0.05, 0.01.
  • Jika $p \le \alpha$, tolak $H_{0}$; selain itu, gagal menolak $H_{0}$.
  • $\alpha$ harus ditetapkan sebelum uji hipotesis.
Pengujian Hipotesis di R

Menghitung p-value

alpha <- 0.05
prop_child_samp <- stack_overflow %>%
  summarize(
    point_estimate = mean(age_first_code_cut == "child")
  ) %>%
  pull(point_estimate)
prop_child_hyp <- 0.35
std_error <- 0.0096028
z_score <- (prop_child_samp - prop_child_hyp) / std_error
p_value <- pnorm(z_score, lower.tail = FALSE)
3.818e-05
p_value <= alpha
TRUE

p_value kurang dari atau sama dengan alpha, jadi tolak $H_{0}$ dan terima $H_{A}$.

Proporsi data scientist yang mulai pemrograman sejak kecil lebih dari 35%.

Pengujian Hipotesis di R

Interval kepercayaan

Untuk taraf signifikansi 0.05, umum dipilih interval kepercayaan 1 - 0.05 = 0.95.

conf_int <- first_code_boot_distn %>%
  summarize(
    lower = quantile(first_code_child_rate, 0.025),
    upper = quantile(first_code_child_rate, 0.975)
  )
# A tibble: 1 x 2
  lower upper
  <dbl> <dbl>
1 0.369 0.407
Pengujian Hipotesis di R

Jenis galat

Benar tidak melakukan kejahatan Benar melakukan kejahatan
Vonis tidak bersalah benar lolos dari hukuman
Vonis bersalah vonis salah benar

 

$H_{0}$ benar $H_{A}$ benar
pilih $H_{0}$ benar false negative
pilih $H_{A}$ false positive benar

 

False positive adalah galat Tipe I; false negative adalah galat Tipe II.

Pengujian Hipotesis di R

Galat yang mungkin pada contoh kita

Jika $p \le \alpha$, kita menolak $H_{0}$:

  • Bisa terjadi false positive (Tipe I): kita mengira data scientist lebih sering mulai ngoding sejak kecil, padahal tidak.

Jika $ p \gt \alpha$, kita gagal menolak $H_{0}$:

  • Bisa terjadi false negative (Tipe II): kita mengira data scientist dan software engineer mulai ngoding sejak kecil pada tingkat yang sama, padahal data scientist lebih tinggi.
Pengujian Hipotesis di R

Ayo berlatih!

Pengujian Hipotesis di R

Preparing Video For Download...