Tabakalı Rastgele Örnekleme

Python ile Anket Verilerini Analiz Etme

EbunOluwa Andrew

Data Scientist

Tabakalı rastgele örnekleme nedir

  • Tabakalı örnekleme, toplumu daha iyi yansıtır
  • Benzer özelliklere göre toplumun ayrık birimlere (tabakalara) bölünmesidir
  • Oranların toplumla eşleşmesi için örneklemin yeniden seçilmesini içerir

Nüfustaki çeşitliliğin değişimi olarak büyük bir grubun demografik değişimi

Python ile Anket Verilerini Analiz Etme

Neden tabakalı rastgele örnekleme kullanılır?

  • Seçim yanlılığını en aza indirir
  • Bazı grup(lar)ın temsiliyetini artırır
  • Örnekler:
    • Farklı topluluklar için gelir tahmini
    • Seçim anketi tahmini
    • Yaşam beklentisi tahmini

Elde tutulan sayaçla kişi sayısı sayma

Python ile Anket Verilerini Analiz Etme

Ne zaman tabakalı rastgele örnekleme kullanılmamalı

  • Alt gruplar çakışmamalıdır
    • Birden çok gruba düşen denekler -> yanlış temsil
  • Anket sorusunda çakışma örneği
    • Mevcut işinizde ne kadar süredir çalışıyorsunuz?
      • 1-2 yıl
      • 2-4 yıl

düşünen kadın

Python ile Anket Verilerini Analiz Etme

ABC firmasında yerinde çalışma anketi sonuçları

| employee_id | gender | onsite_work |
|-------------|--------|-------------|
|    fffe6838 | Male   | Yes         |
|   fffe12184 | Female | Yes         |
|    fffe9404 | Female | Yes         |
|   fffe17578 | Male   | Yes         |
|   fffe22257 | Female | Yes         |
|    fffe6217 | Male   | Yes         |
|    fffe7828 | Female | Yes         |
|   fffe18192 | Male   | Yes         |
|    fffe2839 | Female | Yes         |
|   fffe16173 | Female | Yes         |

Python ile Anket Verilerini Analiz Etme

Toplumdaki oranları kontrol edin

survey.gender.value_counts(normalize=True)
Female    0.556
Male      0.444
Name: gender, dtype: float64
Python ile Anket Verilerini Analiz Etme

Toplumdaki oranları görselleştirme

import pandas as pd
import matplotlib.pyplot as plt

survey.gender.value_counts().plot.pie()

Anket kadın/erkek oranı

Python ile Anket Verilerini Analiz Etme

Tabakalı örnekleme örneği

strat_sample = 
survey.groupby(
  'gender', group_keys = False).apply(
  lambda x: x.sample(frac = 0.1))
| employee_id | gender | onsite_work |
|-------------|--------|-------------|
|    fffe4934 | Female | Yes         |
|    fffe3958 | Female | Yes         |
|      fffe18 | Female | Yes         |
|     fffe283 | Female | Yes         |
|   fffe20382 | Female | Yes         |
|    fffe8721 | Male   | Yes         |
|    fffe5955 | Male   | Yes         |
|    fffe7081 | Male   | Yes         |
|     fffe353 | Male   | Yes         |
|    fffe1765 | Male   | Yes         |

Python ile Anket Verilerini Analiz Etme

Örneklemde oranları kontrol edin

Orijinal toplum

survey.gender.value_counts(normalize=True)

Tabakalı örneklem

strat_sample.gender.value_counts(
  normalize=True))
Female    0.556
Male      0.444
Name: gender, dtype: float64
Female    0.56
Male      0.44
Name: gender, dtype: float64
Python ile Anket Verilerini Analiz Etme

Hadi pratik yapalım!

Python ile Anket Verilerini Analiz Etme

Preparing Video For Download...