T-toets voor twee steekproeven

Enquètegegevens analyseren in Python

EbunOluwa Andrew

Data Scientist

Aardigheid vergelijken

mensen die handen schudden

group_a.agreeableness.mean()
4.011701199563795
group_b.agreeableness.mean()
4.03669574700109
Enquètegegevens analyseren in Python

Definitie t-toets twee steekproeven

  • Toetst of de gemiddelden van twee onafhankelijke groepen significant verschillen
  • Bepaalt of verschillen toeval zijn

Flesjes met labels A en B

Enquètegegevens analyseren in Python

Aannames voor t-toets twee steekproeven

  • Onafhankelijk
  • Normale verdeling
    • Shapiro-Wilk-toets
    • stats.shapiro()
    • p-waarde > 0.05 -> normaal verdeeld
  • Gelijke varianties
    • Levene-toets
    • stats.levene()
    • p-waarde > 0.05 -> gelijke varianties

Houten blok cijfers

Enquètegegevens analyseren in Python

Enquêteresultaten

group_a

| userid | agreeableness |
|--------|---------------|
|    895 |          4.78 |
|    a06 |          3.40 |
|    e94 |          3.66 |
|    ee6 |          5.41 |
|    521 |          4.58 |
|    f4c |          3.24 |
...

1 = Niet-aardig

group_b

| userid | agreeableness |
|--------|---------------|
|    b7e | 4.43          |
|    030 | 2.92          |
|    f91 | 4.01          |
|    36f | 2.20          |
|    875 | 3.83          |
|    750 | 4.95          |
...

7 = Aardig

Enquètegegevens analyseren in Python

Onafhankelijke groepen

twee groepen

Enquètegegevens analyseren in Python

Normaal verdeelde groepen

from scipy.stats import shapiro
import scipy.stats as stats

norm_A = stats.shapiro(
  group_a.agreeableness)

ShapiroResult(
statistic=0.997467577457428,
pvalue=0.16834689676761627)
from scipy.stats import shapiro
import scipy.stats as stats

norm_B = stats.shapiro(
  group_b.agreeableness)

ShapiroResult(
statistic=0.9987381100654602,
pvalue=0.7757995128631592)
Enquètegegevens analyseren in Python

Gelijke varianties

import scipy.stats as stats

var_test = stats.levene(group_a.agreeableness, group_b.agreeableness)
LeveneResult(statistic=0.40492634057696597, pvalue=0.5246354858484796)
Enquètegegevens analyseren in Python

Aannames gecheckt

  • Onafhankelijke groepen
    • geen overlap van individuen
  • Normaal verdeelde groepen
  • Gelijke varianties
    • geen significant verschil tussen de twee varianties

Apple Pencil-foto door Dose Media op Unsplash

Enquètegegevens analyseren in Python

T-toets twee steekproeven met statsmodels

from scipy import stats

stats.ttest_ind(group_a.agreeableness, group_b.agreeableness)
Enquètegegevens analyseren in Python

T-toets twee steekproeven met statsmodels

Ttest_indResult(statistic=0.7746406648066304, pvalue=0.4386519848366188)
Enquètegegevens analyseren in Python

Vervolg analyse

group_a_mean = 4.011701199563795
group_b_mean = 4.03669574700109

De huizenmarkt in Californië

Enquètegegevens analyseren in Python

Laten we oefenen!

Enquètegegevens analyseren in Python

Preparing Video For Download...