Teknik Pemodelan Statistik

Menganalisis Data Survei di Python

EbunOluwa Andrew

Data Scientist

Mengapa menggunakan teknik pemodelan statistik dalam analisis survei?

  • Membuat prediksi dari hubungan antar variabel
  • Memungkinkan alat visualisasi
    • Insight lebih mudah diingat

Foto oleh Chris Liverani di Unsplash - pria memegang ponsel hitam di depan monitor layar hitam

1 Foto oleh Chris Liverani di Unsplash
Menganalisis Data Survei di Python

Kapan menggunakan teknik pemodelan statistik

  • Data sulit
  • Pengaruh antar variabel
  • Prediksi hasil

Foto oleh Tyler Easton di Unsplash - angka acak tercetak di dinding

1 Foto oleh Tyler Easton di Unsplash
Menganalisis Data Survei di Python

Contoh teknik pemodelan statistik

  • Regresi linear
  • Uji t dua sampel
  • Uji chi-kuadrat

Foto oleh Алекс Арцибашев di Unsplash - balok batang meningkat

Menganalisis Data Survei di Python

Model regresi linear

  • Model regresi linear
    • Mengasumsikan hubungan linear antara variabel x dan y
    • y = m*x + b
    • y = variabel dependen
    • x = variabel independen
    • m = kemiringan (slope)
    • b = intersep y

Foto dari Seeing Theory-Brown.edu - garis terbaik di antara titik-titik

1 Foto dari Seeing Theory-Brown.edu
Menganalisis Data Survei di Python

Regresi linear dalam analisis survei

employee gender company_type wfh_available mental_fatigue_score burn_rate
fff200 Male Service No 3 0.24
fff500 Female Service Yes 5.7 0.45
fff700 Female Service Yes 5.8 0.49
fff300 Female Service Yes 6.7 0.63
fff100 Female Product Yes 4.7 0.38
fff400 Male Service Yes 3.4 0.28
fff600 Female Product Yes 5.4 0.5
fffe3400 Female Product No 6.7 0.58
fffe200 Male Service Yes 6.3 0.48
fffe3000 Male Service Yes 5.4 0.41
Menganalisis Data Survei di Python

Regresi linear dalam analisis survei

data.plot.scatter(
x='mental_fatigue_score',
y='burn_rate')
plt.show()

burn_rate vs. mental_fatigue_score

Menganalisis Data Survei di Python

Uji t dua sampel

  • Menguji perbedaan bermakna secara statistik antara dua mean populasi
  • Hipotesis nol = dua mean populasi sama
  • Hipotesis alternatif = dua mean populasi tidak sama

Foto oleh Olesia Bahrii di Unsplash - dua tandan anggur

1 Foto oleh Olesia Bahrii di Unsplash
Menganalisis Data Survei di Python

Uji t dua sampel dalam analisis survei

employee gender company_type wfh_available mental_fatigue_score burn_rate
fff100 Female Product Yes 4.7 0.38
fff400 Male Service Yes 3.4 0.28
fff600 Female Product Yes 5.4 0.5
company_type burn_rate
Service 0.57
Service 0.75
Service 0.51
Service 0.57
company_type burn_rate
Product 0.51
Product 0.79
Product 0.66
Product 0.39
Menganalisis Data Survei di Python

Uji chi-kuadrat

  • Menguji signifikansi statistik antara dua variabel kategorikal
  • Hipotesis nol = tidak ada asosiasi signifikan antar variabel
  • Hipotesis alternatif = ada asosiasi signifikan
Menganalisis Data Survei di Python

Uji chi-kuadrat dalam analisis survei

  • Variabel #1

    • company_type
    • Product atau Service
  • Variabel #2

    • wfh_available
    • Yes atau No
company_type wfh_available
Product Yes
Product Yes
Product No
Service Yes
Service Yes
Product Yes
Service No
Service No
Product Yes
Service Yes
Menganalisis Data Survei di Python

Teknik mana yang digunakan? - regresi linear

Kedua variabel = numerik

plot sebar kalori vs. menit

Menganalisis Data Survei di Python

Teknik mana yang digunakan? - uji t dua sampel

  • Uji t dua sampel
    • Satu variabel = kategorikal
    • Satu variabel = numerik

Foto oleh Diana Polekhina di Unsplash - pita ukur hitam putih di permukaan kuning

1 Foto oleh Diana Polekhina di Unsplash
Menganalisis Data Survei di Python

Teknik mana yang digunakan? - uji chi-kuadrat

  • Uji chi-kuadrat
    • Kedua variabel = kategorikal

Foto oleh Element5 Digital di Unsplash - siluet pemungutan suara

1 Foto oleh Element5 Digital di Unsplash
Menganalisis Data Survei di Python

Ayo berlatih!

Menganalisis Data Survei di Python

Preparing Video For Download...