Aselecte steekproef

Enquètegegevens analyseren in Python

EbunOluwa Andrew

Data Scientist

Steekproeven bij enquête-analyse

  • Steekproef = kleine set uit grote populatie
    • Trek conclusies over de populatie
    • Maakt data behapbaar
    • Geeft steekproeffout
    • Beperk fout met grote populatie

Foto door Patrick Fore op Unsplash - kind met snoepjes

Enquètegegevens analyseren in Python

Aselecte steekproef

  • Elke deelnemer heeft gelijke kans om gekozen te worden
  • Vermindert bias
  • Hoge interne validiteit
  • Hoge externe validiteit

lotterijtickets

Enquètegegevens analyseren in Python

.sample()-methode

  • DataFrame.sample(n = _None_, frac = _None_, random_state = _None_)
  • n = aantal rijen om te nemen
  • frac = deel (0–1) van rijen om te nemen
  • random_state = zaad voor reproduceerbare uitkomst
Enquètegegevens analyseren in Python

Voorbeeld: aselecte steekproef

import pandas as pd
survey = pd.read_csv('ABC_survey.csv')

sample = survey.sample(n=100) print(sample)
|       | employee_id | gender | onsite_work |
|-------|-------------|--------|-------------|
| 3244  | fffe330     | Female | Yes         |
| 21339 | fffe310     | Male   | Yes         |
| 1122  | fffe390     | Male   | Yes         |
| 4363  | fffe313     | Female | Yes         |
Enquètegegevens analyseren in Python

Voorbeeld: aselecte steekproef

import pandas as pd
survey = pd.read_csv('ABC_survey.csv')

sample = survey.sample(frac = 0.1) print(sample)
|     | employee_id | gender | onsite_work |
|-----|-------------|--------|-------------|
| 142 | fffe800     | Female | Yes         |
| 710 | fffe900     | Female | Yes         |
| 242 | fffe700     | Female | Yes         |
| 114 | fffe600     | Female | Yes         |
Enquètegegevens analyseren in Python

Voorbeeld: aselecte steekproef

import pandas as pd
survey = pd.read_csv('ABC_survey.csv')

sample = survey.sample( n = 100, random_state = 123)
import pandas as pd
survey = pd.read_csv('ABC_survey.csv')

sample = survey.sample( frac = 0.1, random_state = 123)
|       | employee_id | gender | onsite_work |
|-------|-------------|--------|-------------|
| 21383 | fffe3       | Female | Yes         |
| 82    | fffe0       | Male   | Yes         |
| 20739 | fffe2       | Male   | Yes         |
| 7662  | fffe9       | Female | Yes         |
|       | employee_id | gender | onsite_work |
|-------|-------------|--------|-------------|
| 21383 | fffe3       | Female | Yes         |
| 82    | fffe0       | Male   | Yes         |
| 20739 | fffe2       | Male   | Yes         |
| 7662  | fffe9       | Female | Yes         |
Enquètegegevens analyseren in Python

Laten we oefenen!

Enquètegegevens analyseren in Python

Preparing Video For Download...