Effectgrootte

Basis van inferentie in Python

Paul Savala

Assistant Professor of Mathematics

Wat is effectgrootte?

Een arts houdt een gebroken sigaret vast.

Effectgrootte: maat voor de sterkte tussen twee variabelen

Een verzameling junkfood.

Waarom effectgrootte meten

Meet de sterkte van de relatie
Roken: Grote effectgrootte
Slecht dieet: Kleine effectgrootte

P-waarden

Bestaat er een relatie?
Komt uit een hypothesetoets

Effectgrootte

Hoe sterk is de relatie?
Los van een hypothesetoets

Effectgrootte voor gemiddelden - Cohens d

$n_1 = \text{Steekproefgrootte van groep 1}$

$n_2 = \text{Steekproefgrootte van groep 2}$

$s_1 = \text{Standaarddeviatie van groep 1}$

$s_2 = \text{Standaarddeviatie van groep 2}$

$\overline{x}_1 = \text{Gemiddelde van groep 1}$

$\overline{x}_2 = \text{Gemiddelde van groep 2}$

$s = \displaystyle\sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 - 2}}$

Cohens $d = \displaystyle\frac{\overline{x}_1 - \overline{x}_2}{s}$

Cohens d interpreteren

0,01 - Zeer klein
0,20 - Klein
0,50 - Middelgroot
0,80 - Groot
1,20 - Zeer groot

Cohens $d = 0.6$

Middelgroot tot groot effect

¹ https://books.google.com/books?id=2v9zDAsLvA0C&pg=PP1 https://doi.org/10.22237%2Fjmasm%2F1257035100

Effectgrootte bij correlatie

r, p_value = stats.pearsonr(
    btc_sp_df['Close_BTC'], 
    btc_sp_df['Close_SP500']
    )


print(r**2)

0.82

$R^2:$ Percentage variantie in de ene variabele verklaard door de andere te kennen

Een spreidingsdiagram met de S&P 500-slotkoers op de x-as en de Bitcoin-slotkoers op de y-as. De grafiek is grofweg lineair met een positieve helling.

Effectgrootte voor categorische variabelen

$\chi^2$ = Chi-kwadraatstatistiek uit kruistabel
$n$ = totaal aantal datapunten
$d$ = vrijheidsgraden = $min(\text{rijen}-1, \text{kolommen}-1)$

Cramers $V = \displaystyle\sqrt{\frac{\chi^2/n}{d}}$

Cramers V berekenen

chi2, p, d, e = stats.chi2_contingency(
    contingency_table)


dof = min(6-1, 2-1) = 1
n = 3394


v = np.sqrt((chi2 / n) / dof)

v = 0.52

Een tabel met mannen en vrouwen en functietitels. De tabel toont hoeveel mannen en vrouwen elke functie hebben.

¹ https://en.wikipedia.org/wiki/Degrees_of_freedom_(statistics)

Cramers V interpreteren

Cramer's V = 0.52, Degrees of Freedom = 1

Een tabel met vrijheidsgraden van één tot en met vijf, en de Cramers V-waarden voor kleine, middelgrote en grote effecten. Klein: 0,1; 0,07; 0,06; 0,05; 0,04. Middel: 0,3; 0,21; 0,17; 0,15; 0,13. Groot: 0,5; 0,35; 0,29; 0,25; 0,22.

¹ https://www.statology.org/interpret-cramers-v

Laten we oefenen!

Basis van inferentie in Python