Niet-parametrische toetsen

Basis van inferentie in Python

Paul Savala

Assistant Professor of Mathematics

Niet-parametrische toetsen

  • Kunnen aannames hebben
  • Vereisen géén normaliteit
  • Toepasbaar op veel soorten data
  • Soms minder krachtig
  • Handig voor rangen (bv. sterrenratings)

Vier histogrammen, elk met anders gevormde data.

Basis van inferentie in Python

Parametrische toetsen

 

  • Onafhankelijke t-toets
  • ANOVA
  • Gepaarde t-toets
  • Pearson’s r

Niet-parametrisch

 

  • Wilcoxon-Mann-Whitney U-toets
  • Kruskal-Wallis-toets
  • Mood’s mediaantoets
  • Kendalls tau
Basis van inferentie in Python

Mood’s mediaantoets

Vergelijkt medianen van twee gepaarde metingen

Vijf rijen van een DataFrame met verschillende universiteiten, en twee kolommen met universiteitsscores.

Waarschijnlijk niet normaal verdeeld

s, p_value, m, table = stats.median_test(df['thew_score'], df['arw_score'])
Basis van inferentie in Python

Mood’s mediaantoets

print(p_value < 0.05)
TRUE
  • Conclusie: Verschillende mediane rangen
  • t-toetsen veronderstellen normaliteit (Mood’s mediaantoets niet)
  • Geldige inferentie alleen als data en aannames kloppen
  • Kies het juiste hulpmiddel!
Basis van inferentie in Python

Kendalls tau

  • Waarden tussen -1 en 1
  • $\tau = -1$: Volledige onenigheid
  • $\tau = 0$: Geen correlatie
  • $\tau = 1$: Volledige overeenstemming

Vijf rijen van een DataFrame met verschillende universiteiten, met rankings per universiteit.

tau, p_value = stats.kendalltau(
    df['thew_rank'], 
    df['arw_rank'])

print(tau, p_value < 0.05)
0.651, TRUE
Basis van inferentie in Python

Laten we oefenen!

Basis van inferentie in Python

Preparing Video For Download...