Niet-parametrische toetsen

A/B-testen in Python

Moe Lotfy, PhD

Principal Data Science Manager

Aannames parametrische toetsen

Aselecte steekproef
- Data is willekeurig getrokken uit de populatie.
- Onderzoek het verzamel-/steekproefproces.
Onafhankelijkheid
- Elke observatie/datapunt is onafhankelijk.
- Afhankelijkheden negeren vergroot foutkans.
Normaliteit
- Normaal verdeelde data.
- Voldoende grote steekproef.
  - Two-sample t-test: n >= 30 per groep.
  - Two-sample proportietoets: >=10 successen en >=10 missers per groep.

Mann-Whitney U-toets

Niet-parametrische significantietoets
Bepaalt of twee onafhankelijke steekproeven uit dezelfde verdeling komen
Rangsomtoets
Onafgematchte data

Mann-Whitney U-toets in Python

# Calculate the mean and count of time on page by variant
print(checkout.groupby('checkout_page')['time_on_page'].agg({'mean', 'count'}))

                    mean  count
checkout_page                  
A              44.668527   3000
B              42.723772   3000
C              42.223772   3000

# Set random seed for repeatability 
np.random.seed(40)
# Take a random sample of size 25 from each variant
ToP_samp_A = checkout[checkout['checkout_page'] == 'A'].sample(25)['time_on_page']
ToP_samp_B = checkout[checkout['checkout_page'] == 'B'].sample(25)['time_on_page']

Mann-Whitney U-toets in Python

# Run a Mann-Whitney U test
mwu_test = pingouin.mwu(x=ToP_samp_A,
                        y=ToP_samp_B,
                        alternative='two-sided')
# Print the test results
print(mwu_test)

     U-val alternative     p-val     RBC    CLES
MWU  441.0   two-sided  0.013007 -0.4112  0.7056

Chi-kwadraattoets op onafhankelijkheid

Vrij van aannames van parametrische toetsen
Test of twee of meer categorische variabelen onafhankelijk zijn
- Nulhypothese: de variabelen zijn onafhankelijk.
- Alternatieve hypothese: de variabelen zijn niet onafhankelijk.

Chi-kwadraattoets in Python

A/B-test aanmeldingspercentages homepage

Nul: geen significant verschil in aanmeldingspercentages tussen landingspagina’s C en D

Alternatief: er is een significant verschil tussen hen

# Calculate the number of users in groups C and D
n_C = homepage[homepage['landing_page'] == 'C']['user_id'].nunique()
n_D = homepage[homepage['landing_page'] == 'D']['user_id'].nunique()

# Compute unique signups in each group
signup_C = homepage[homepage['landing_page'] == 'C'].groupby('user_id')['signup'].max().sum()
no_signup_C = n_C - signup_C
signup_D = homepage[homepage['landing_page'] == 'D'].groupby('user_id')['signup'].max().sum()
no_signup_D = n_D - signup_D

Chi-kwadraattoets in Python

# Create the signups table
table = [[signup_C, no_signup_C], [signup_D, no_signup_D]]
print('Group C signup rate:',round(signup_C/n_C,3))
print('Group D signup rate:',round(signup_D/n_D,3))

# Calculate p-value
print('p-value=',stats.chi2_contingency(table,correction=False)[1])

Group C signup rate: 0.064
Group D signup rate: 0.048
p-value= 0.009165

Laten we oefenen!

A/B-testen in Python