Statistik deskriptif dalam analisis survei

Menganalisis Data Survei di Python

EbunOluwa Andrew

Data Scientist

Apa itu statistik deskriptif dalam analisis survei?

  • Ukuran dasar untuk mendeskripsikan data survei.
  • Berisi deskripsi variabel tunggal dan sampel survei terkait.

kaca pembesar dan pena di atas grafik

Menganalisis Data Survei di Python

Mengapa memakai statistik deskriptif?

  • Membantu meringkas data dengan jelas
  • Bentuk
    • Tabel
    • Visualisasi
  • Membantu mengidentifikasi outlier

Grafik dengan kaca pembesar

Menganalisis Data Survei di Python

Frekuensi dan distribusi

  • Mengelompokkan data berdasarkan jumlah kemunculan per kelas
  • Untuk data kualitatif dan kuantitatif
  • Hitung berbagai hasil dalam data mentah survei
  • Diagram batang, histogram, pai, garis, dll.

Melihat data statistik, grafik, dan bagan

Menganalisis Data Survei di Python

Pemusatan: mean, median, mode

  • Nilai tunggal yang mencerminkan pusat distribusi data
  • Mean = nilai rata-rata
  • Median = nilai tengah saat diurut naik
  • Mode = nilai paling sering muncul
Menganalisis Data Survei di Python

Ukuran keragaman

  • Menentukan seberapa jauh data dari pusat
  • Rentang
    • Jarak antara nilai tertinggi dan terendah
  • Simpangan baku
    • Rata-rata variasi
    • Wawasan tentang jarak tiap nilai dari mean

Kerumunan dari atas membentuk grafik pertumbuhan dengan garis yang menghubungkan

Menganalisis Data Survei di Python

Survei: dietary_habits

dietary_habits.head()
| Age   | Gender | meals_per_day | eat_out_per_wk |
|-------|--------|---------------|----------------|
| 18-24 | Male   |             5 |              4 |
| 18-24 | Male   |             4 |              1 |
| 45-54 | Male   |             3 |              3 |
| 18-24 | Male   |             2 |              1 |
| 18-24 | Female |             3 |              1 |
Menganalisis Data Survei di Python

Distribusi frekuensi: dietary_habits

dietary_habits.Gender.value_counts().to_frame("Number")
|        | Number |
|--------|--------|
| Male   | 40     |
| Female | 38     |

Index: Gender

Menganalisis Data Survei di Python

Distribusi frekuensi: dietary_habits

dietary_habits.Gender.value_counts().to_frame("Number").plot(kind='bar')

diagram batang distribusi frekuensi gender

Menganalisis Data Survei di Python

Ukuran pemusatan: dietary_habits

  • .mean()
  • .median()
  • .mode()
Menganalisis Data Survei di Python

Ukuran pemusatan: dietary_habits

  • .mean()
dietary_habits.mean()
| meals_per_day  | 3.128205 |
| eat_out_per_wk | 1.897436 |
| dtype: float64 |          |
Menganalisis Data Survei di Python

Ukuran pemusatan: dietary_habits

  • .median()
dietary_habits.median()
| meals_per_day  | 3.0 |
| eat_out_per_wk | 1.5 |
| dtype: float64 |     |
Menganalisis Data Survei di Python

Ukuran pemusatan: dietary_habits

  • .mode()
dietary_habits.mode()
| Age   | Gender | meals_per_day | eat_out_per_wk |
|-------|--------|---------------|----------------|
| 18-24 | Male   |             3 |              1 |
Menganalisis Data Survei di Python

Ukuran keragaman: dietary_habits

print(dietary_habits.meals_per_day.max() - dietary_habits.meals_per_day.min())
3
print(dietary_habits.meals_per_day.std())
0.6518500018473766
Menganalisis Data Survei di Python

Ayo berlatih!

Menganalisis Data Survei di Python

Preparing Video For Download...