Korelasi

Menganalisis Data Survei di Python

EbunOluwa Andrew

Data Scientist

Korelasi dalam analisis survei

  • Saling ketergantungan variabel
    • Saat satu variabel berubah, yang lain ikut berubah
  • Mengukur hubungan linear antara dua butir survei
  • Korelasi TIDAK selalu kausal
    • Mungkin ada variabel ketiga yang memengaruhi
    • Tidak bisa disimpulkan variabel mana yang menyebabkan perubahan pada yang lain

Korelasi bukan kausalitas. Tipografi

Menganalisis Data Survei di Python

Kekuatan dan arah korelasi

  • Koefisien korelasi -> 'r'
  • -1,0 hingga 1,0
    • -1 atau 1 = hubungan sempurna
    • 0 = tidak ada hubungan bermakna
    • < 0 = hubungan negatif
    • 0 = hubungan positif

  • Sampel kecil: perlu korelasi lebih kuat untuk signifikansi statistik

Korelasi antara potongan puzzle

Menganalisis Data Survei di Python

Fungsi .corr()

  • .corr()
  • _kolom_pertama_.corr(_kolom_kedua_)

Jenis korelasi

Menganalisis Data Survei di Python

Contoh .corr(): healthy_city

| City       | Rank | Life expectancy_years | Happiness levels |
|------------|------|-----------------------|------------------|
| Amsterdam  |    1 |                  81.2 |             7.44 |
| Sydney     |    2 |                  82.1 |             7.22 |
| Vienna     |    3 |                    81 |             7.29 |
| Stockholm  |    4 |                  81.8 |             7.35 |
| Copenhagen |    5 |                  79.8 |             7.64 |
| Helsinki   |    6 |                  80.4 |              7.8 |
| Fukuoka    |    7 |                  83.2 |             5.87 |
| Berlin     |    8 |                  80.6 |             7.07 |
| Barcelona  |    9 |                  82.2 |              6.4 |
Menganalisis Data Survei di Python

Contoh .corr(): healthy_city

import matplotlib.pyplot as plt
plt.scatter(healthy_city['Life expectancy_years'],
            healthy_city['Happiness levels'])

plot sebar happy_survey

Menganalisis Data Survei di Python

Contoh .corr(): healthy_city

happy_survey['Happiness levels'].corr(
  happy_survey['Life expectancy_years'])
0.7245870841569987
Menganalisis Data Survei di Python

Ayo berlatih!

Menganalisis Data Survei di Python

Preparing Video For Download...