Uji kenormalan

Dasar-dasar Inferensi di Python

Paul Savala

Assistant Professor of Mathematics

Tinggi pria AS

Histogram yang kira-kira normal, dengan tinggi rata-rata 180 sentimeter, tinggi minimum 160 sentimeter, dan tinggi maksimum 200 sentimeter.

Dasar-dasar Inferensi di Python

Residual model

Diagram sebar dengan tahun masa kerja pada sumbu-x, gaji tahunan pada sumbu-y, dan tren linear positif. Garis merah garis terbaik juga digambar.

Harapkan sebaran setara di atas dan di bawah prediksi

Dasar-dasar Inferensi di Python

Residual model

Histogram dengan "residual (galat)" pada sumbu-x, "jumlah" pada sumbu-y, dan distribusi bimodal dengan modus sekitar minus sepuluh ribu, dan satu lagi sekitar plus tiga puluh ribu.

Dasar-dasar Inferensi di Python

Aplikasi distribusi normal

  • Uji parametrik - uji hipotesis yang mengasumsikan kenormalan
  • Uji t untuk membandingkan mean:
    • Mengasumsikan mean sampel berdistribusi normal
    • Jika tidak, kesimpulan tidak valid
Dasar-dasar Inferensi di Python

Histogram dengan gaji antara enam puluh ribu dan sembilan puluh lima ribu pada sumbu-x, dan frekuensi pada sumbu-y. Histogram relatif mendekati normal.

Dasar-dasar Inferensi di Python

Uji Anderson–Darling untuk kenormalan

  • Menguji asumsi kenormalan

$H_0$: Data berdistribusi normal

$H_a$: Data tidak berdistribusi normal

Dasar-dasar Inferensi di Python

Uji Anderson–Darling di SciPy

result = stats.anderson(police_df['Annual Salary'])

result.statistic
27.41
result.critical_values
[0.574, 0.654, 0.784, 0.915, 1.088]
result.significance_level[result.statistic > result.critical_values]
[15.  10.   5.   2.5  1. ]
Dasar-dasar Inferensi di Python

Memasang distribusi normal

mu, std = stats.norm.fit(police_df['Annual Salary'])

estimated_pct_under_70k = stats.norm.cdf(70000, loc=mu, scale=std)
print(estimated_pct_under_70k)
0.27
actual_under_70k = police_df[police_df['Annual Salary'] < 70000]

print(len(actual_under_70k) / len(police_df))
0.20
Dasar-dasar Inferensi di Python

Ayo berlatih!

Dasar-dasar Inferensi di Python

Preparing Video For Download...