Kümelere Göre Örnekleme

Python ile Anket Verilerini Analiz Etme

EbunOluwa Andrew

Data Scientist

Kümelere göre örnekleme nedir?

  • Tüm anakütle birkaç alt gruba ayrılır

    • Alt gruplar, anakütleyle benzer özelliklere sahiptir
  • Anakütle -> Kümeler

  • Bireyler örneklenmez; rastgele olarak tüm alt grup seçilir

insanlardan oluşan pasta grafik

Python ile Anket Verilerini Analiz Etme

Kümelere göre örnekleme neden önemlidir?

  • Her zaman tüm anakütleden veri toplayamayız
  • Anakütle büyük olduğunda hatayı azaltır

aşırı nüfus

Python ile Anket Verilerini Analiz Etme

Kümelere göre örnekleme adımları

  • Önce, anakütleyi kümelere ayırın
  • Sonra, bu kümelerden rastgele seçim yapın

insan kümesi

Python ile Anket Verilerini Analiz Etme

Örnek veri seti

print(mh_survey)
| gender | sought_treatment | country_work             |
|--------|------------------|--------------------------|
| Male   |                0 | United Kingdom           |
| Male   |                1 | United States of America |
| Male   |                1 | United Kingdom           |
| Male   |                1 | United Kingdom           |
| Female |                1 | United States of America |
| Male   |                1 | United Kingdom           |
| Male   |                0 | United States of America |
...
Python ile Anket Verilerini Analiz Etme

Örnek veri seti ve grafik

mh_survey.groupby('country_work')[
  'gender'].count()
groups = mh_survey.groupby(
  'country_work')['gender'].count(
).reset_index()
groups.columns=['country_work','count']

groups.plot.bar(x='country_work',
                y='count')

BT çalışanlarının yaşadığı yerlerin çubuk grafiği

1 _Alan kısıtından dolayı verilerin bir kısmı çizildi_
Python ile Anket Verilerini Analiz Etme

Kümeleri seçin

unique_countries = list(set(mh_survey.country_work))

random_clusters = np.random.choice(unique_countries, size = 10, replace = False)

print(random_clusters)
array(['Finland', 'Australia', 'Sweden', 'South Africa', 'Pakistan',
       'France', 'Ecuador', 'United Arab Emirates', 'United Kingdom',
       'Bangladesh'], dtype='<U24')
Python ile Anket Verilerini Analiz Etme

Küme örneklemi oluşturun

cluster_sample = mh_survey[mh_survey.country_work.isin(random_clusters)]
print(cluster_sample.head())
| gender | sought_treatment | US_state_live        |
|--------|------------------|----------------------|
| Male   |                1 |             Pakistan |
| Male   |                1 |             Pakistan |
| Male   |                1 | United Arab Emirates |
| Male   |                1 |             Pakistan |
| Female |                0 |           Bangladesh |
Python ile Anket Verilerini Analiz Etme

Küme örneklemini görselleştirin

treatment_pie = cluster_sample.sought_treatment.value_counts(normalize = True)
treatment_pie.plot.pie()

sought_treatment pasta grafiği

Python ile Anket Verilerini Analiz Etme

Küme örneklemini görselleştirin

array(['Bangladesh', 'South Africa', 'Other', 'Norway', 'Poland',
       'Romania', 'New Zealand', 'France', 'United States of America',
       'Bulgaria'], dtype='<U24')

sought_treatment pasta grafiği

Python ile Anket Verilerini Analiz Etme

Hadi pratik yapalım!

Python ile Anket Verilerini Analiz Etme

Preparing Video For Download...