Effectgrootte

Basis van inferentie in Python

Paul Savala

Assistant Professor of Mathematics

Wat is effectgrootte?

Een arts houdt een gebroken sigaret vast.

  • Effectgrootte: maat voor de sterkte tussen twee variabelen

Een verzameling junkfood.

Basis van inferentie in Python

Waarom effectgrootte meten

  • Meet de sterkte van de relatie
  • Roken: Grote effectgrootte
  • Slecht dieet: Kleine effectgrootte
Basis van inferentie in Python

P-waarden

 

  • Bestaat er een relatie?
  • Komt uit een hypothesetoets

Effectgrootte

 

  • Hoe sterk is de relatie?
  • Los van een hypothesetoets
Basis van inferentie in Python

Effectgrootte voor gemiddelden - Cohens d

$n_1 = \text{Steekproefgrootte van groep 1}$

$n_2 = \text{Steekproefgrootte van groep 2}$

$s_1 = \text{Standaarddeviatie van groep 1}$

$s_2 = \text{Standaarddeviatie van groep 2}$

$\overline{x}_1 = \text{Gemiddelde van groep 1}$

$\overline{x}_2 = \text{Gemiddelde van groep 2}$

$s = \displaystyle\sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 - 2}}$

Cohens $d = \displaystyle\frac{\overline{x}_1 - \overline{x}_2}{s}$

Basis van inferentie in Python

Cohens d interpreteren

  • 0,01 - Zeer klein
  • 0,20 - Klein
  • 0,50 - Middelgroot
  • 0,80 - Groot
  • 1,20 - Zeer groot

Cohens $d = 0.6$

Middelgroot tot groot effect

1 https://books.google.com/books?id=2v9zDAsLvA0C&pg=PP1 https://doi.org/10.22237%2Fjmasm%2F1257035100
Basis van inferentie in Python

Effectgrootte bij correlatie

r, p_value = stats.pearsonr(
    btc_sp_df['Close_BTC'], 
    btc_sp_df['Close_SP500']
    )

print(r**2)
0.82

$R^2:$ Percentage variantie in de ene variabele verklaard door de andere te kennen

Een spreidingsdiagram met de S&P 500-slotkoers op de x-as en de Bitcoin-slotkoers op de y-as. De grafiek is grofweg lineair met een positieve helling.

Basis van inferentie in Python

Effectgrootte voor categorische variabelen

  • $\chi^2$ = Chi-kwadraatstatistiek uit kruistabel
  • $n$ = totaal aantal datapunten
  • $d$ = vrijheidsgraden = $min(\text{rijen}-1, \text{kolommen}-1)$

Cramers $V = \displaystyle\sqrt{\frac{\chi^2/n}{d}}$

Basis van inferentie in Python

Cramers V berekenen

chi2, p, d, e = stats.chi2_contingency(
    contingency_table)

dof = min(6-1, 2-1) = 1 n = 3394
v = np.sqrt((chi2 / n) / dof)
v = 0.52

Een tabel met mannen en vrouwen en functietitels. De tabel toont hoeveel mannen en vrouwen elke functie hebben.

1 https://en.wikipedia.org/wiki/Degrees_of_freedom_(statistics)
Basis van inferentie in Python

Cramers V interpreteren

Cramer's V = 0.52, Degrees of Freedom = 1

Een tabel met vrijheidsgraden van één tot en met vijf, en de Cramers V-waarden voor kleine, middelgrote en grote effecten. Klein: 0,1; 0,07; 0,06; 0,05; 0,04. Middel: 0,3; 0,21; 0,17; 0,15; 0,13. Groot: 0,5; 0,35; 0,29; 0,25; 0,22.

1 https://www.statology.org/interpret-cramers-v
Basis van inferentie in Python

Laten we oefenen!

Basis van inferentie in Python

Preparing Video For Download...