Uji t dua sampel

Menganalisis Data Survei di Python

EbunOluwa Andrew

Data Scientist

Membandingkan agreeableness

orang berjabat tangan

group_a.agreeableness.mean()
4.011701199563795
group_b.agreeableness.mean()
4.03669574700109
Menganalisis Data Survei di Python

Definisi uji t dua sampel

  • Menguji apakah rata-rata dua kelompok independen berbeda signifikan
  • Menentukan apakah perbedaan terjadi karena kebetulan

Sepasang botol berlabel A dan B

Menganalisis Data Survei di Python

Asumsi untuk uji t dua sampel

  • Independen
  • Distribusi normal
    • Uji Shapiro–Wilk
    • stats.shapiro()
    • p-value > 0,05 -> berdistribusi normal
  • Varians setara
    • Uji Levene
    • stats.levene()
    • p-value > 0,05 -> varians setara

Balok angka kayu

Menganalisis Data Survei di Python

Hasil survei

group_a

| userid | agreeableness |
|--------|---------------|
|    895 |          4.78 |
|    a06 |          3.40 |
|    e94 |          3.66 |
|    ee6 |          5.41 |
|    521 |          4.58 |
|    f4c |          3.24 |
...

1 = Tidak ramah

group_b

| userid | agreeableness |
|--------|---------------|
|    b7e | 4.43          |
|    030 | 2.92          |
|    f91 | 4.01          |
|    36f | 2.20          |
|    875 | 3.83          |
|    750 | 4.95          |
...

7 = Ramah

Menganalisis Data Survei di Python

Kelompok independen

dua kelompok

Menganalisis Data Survei di Python

Kelompok berdistribusi normal

from scipy.stats import shapiro
import scipy.stats as stats

norm_A = stats.shapiro(
  group_a.agreeableness)

ShapiroResult(
statistic=0.997467577457428,
pvalue=0.16834689676761627)
from scipy.stats import shapiro
import scipy.stats as stats

norm_B = stats.shapiro(
  group_b.agreeableness)

ShapiroResult(
statistic=0.9987381100654602,
pvalue=0.7757995128631592)
Menganalisis Data Survei di Python

Varians setara

import scipy.stats as stats

var_test = stats.levene(group_a.agreeableness, group_b.agreeableness)
LeveneResult(statistic=0.40492634057696597, pvalue=0.5246354858484796)
Menganalisis Data Survei di Python

Asumsi terpenuhi

  • Kelompok independen
    • tidak ada individu yang tumpang tindih
  • Kelompok berdistribusi normal
  • Varians setara
    • tidak ada perbedaan signifikan antara kedua varians

Apple Pencil-Foto oleh Dose Media di Unsplash

Menganalisis Data Survei di Python

Uji t dua sampel dengan statsmodels

from scipy import stats

stats.ttest_ind(group_a.agreeableness, group_b.agreeableness)
Menganalisis Data Survei di Python

Uji t dua sampel dengan statsmodels

Ttest_indResult(statistic=0.7746406648066304, pvalue=0.4386519848366188)
Menganalisis Data Survei di Python

Analisis lanjutan

group_a_mean = 4.011701199563795
group_b_mean = 4.03669574700109

Perumahan di California

Menganalisis Data Survei di Python

Ayo berlatih!

Menganalisis Data Survei di Python

Preparing Video For Download...