Normallik testleri

Python'da Çıkarımın Temelleri

Paul Savala

Assistant Professor of Mathematics

ABD erkeklerinin boyu

Yaklaşık normal dağılmış bir histogram; ortalama boy 180 santimetre, minimum 160, maksimum 200 santimetre.

Python'da Çıkarımın Temelleri

Model artıkları

X ekseninde çalışma yılı, y ekseninde yıllık maaş olan, genel olarak pozitif doğrusal eğilimli bir saçılım grafiği. Veriye kırmızı bir en iyi uyum doğrusu çizilmiştir.

Tahminin üstü ve altında eşit dağılım beklenir

Python'da Çıkarımın Temelleri

Model artıkları

X ekseninde "residual (error)", y ekseninde "count" olan bir histogram; yaklaşık -10.000 civarında bir mod ve +30.000 civarında başka bir mod ile iki tepelidir.

Python'da Çıkarımın Temelleri

Normal dağılımların uygulamaları

  • Parametrik testler: Normallik varsayan hipotez testleri
  • Ortalamaları karşılaştırmak için t-testi:
    • Örneklem ortalamalarının normal dağıldığını varsayar
    • Aksi halde sonuçlar geçersizdir
Python'da Çıkarımın Temelleri

X ekseninde altmış bin ile doksan beş bin arasındaki maaşlar, y ekseninde sıklık olan bir histogram. Histogram normale oldukça yakındır.

Python'da Çıkarımın Temelleri

Normallik için Anderson–Darling testi

  • Normallik varsayımını test eder

$H_0$: Veriler normal dağılmıştır

$H_a$: Veriler normal dağılmamıştır

Python'da Çıkarımın Temelleri

SciPy'de Anderson–Darling testi

result = stats.anderson(police_df['Annual Salary'])

result.statistic
27.41
result.critical_values
[0.574, 0.654, 0.784, 0.915, 1.088]
result.significance_level[result.statistic > result.critical_values]
[15.  10.   5.   2.5  1. ]
Python'da Çıkarımın Temelleri

Normal dağılım uydurma

mu, std = stats.norm.fit(police_df['Annual Salary'])

estimated_pct_under_70k = stats.norm.cdf(70000, loc=mu, scale=std)
print(estimated_pct_under_70k)
0.27
actual_under_70k = police_df[police_df['Annual Salary'] < 70000]

print(len(actual_under_70k) / len(police_df))
0.20
Python'da Çıkarımın Temelleri

Haydi pratik yapalım!

Python'da Çıkarımın Temelleri

Preparing Video For Download...