Normaliteitstoetsen

Basis van inferentie in Python

Paul Savala

Assistant Professor of Mathematics

Lengte van Amerikaanse mannen

Een histogram dat ongeveer normaal verdeeld is, met een gemiddelde lengte van 180 centimeter, een minimum van 160 en een maximum van 200 centimeter.

Basis van inferentie in Python

Modelresiduen

Een spreidingsdiagram met dienstjaren op de x-as, jaarsalaris op de y-as, en een overwegend positieve lineaire trend. Er is ook een rode trendlijn getekend.

Verwacht gelijke verdeling boven en onder de voorspelling

Basis van inferentie in Python

Modelresiduen

Een histogram met "residu (fout)" op de x-as, "aantal" op de y-as, en een bimodale verdeling met een modus rond min tienduizend en een andere rond plus dertigduizend.

Basis van inferentie in Python

Toepassingen van normale verdelingen

  • Parametrische toetsen: hypothesetoetsen die normaliteit aannemen
  • T-toets om gemiddelden te vergelijken:
    • Neemt aan dat steekproefgemiddelden normaal verdeeld zijn
    • Zo niet, dan zijn conclusies ongeldig
Basis van inferentie in Python

Een histogram met salarissen tussen zestigduizend en vijfennegentigduizend op de x-as en frequentie op de y-as. Het histogram is vrij normaal.

Basis van inferentie in Python

Anderson-Darling-toets op normaliteit

  • Toetst aanname van normaliteit

$H_0$: Data is normaal verdeeld

$H_a$: Data is niet normaal verdeeld

Basis van inferentie in Python

Anderson-Darling in SciPy

result = stats.anderson(police_df['Annual Salary'])

result.statistic
27.41
result.critical_values
[0.574, 0.654, 0.784, 0.915, 1.088]
result.significance_level[result.statistic > result.critical_values]
[15.  10.   5.   2.5  1. ]
Basis van inferentie in Python

Normale verdeling fitten

mu, std = stats.norm.fit(police_df['Annual Salary'])

estimated_pct_under_70k = stats.norm.cdf(70000, loc=mu, scale=std)
print(estimated_pct_under_70k)
0.27
actual_under_70k = police_df[police_df['Annual Salary'] < 70000]

print(len(actual_under_70k) / len(police_df))
0.20
Basis van inferentie in Python

Laten we oefenen!

Basis van inferentie in Python

Preparing Video For Download...