Beschrijvende statistiek in enquêtes

Enquètegegevens analyseren in Python

EbunOluwa Andrew

Data Scientist

Wat is beschrijvende statistiek bij enquêtes?

  • Basismaatregelen om enquêtegegevens te beschrijven
  • Beschrijven losse variabelen en de steekproef

vergrootglas en pen op grafiek

Enquètegegevens analyseren in Python

Waarom beschrijvende statistiek gebruiken?

  • Maakt data helder samen te vatten
  • Vormen
    • Tabellen
    • Visualisaties
  • Helpt uitschieters vinden

Grafieken met vergrootglas

Enquètegegevens analyseren in Python

Frequentie en verdelingen

  • Groepeert data op aantal keer per klasse
  • Voor kwalitatieve en kwantitatieve data
  • Telt uitkomsten in ruwe enquêtegegevens
  • Staafdiagrammen, histogrammen, cirkeldiagrammen, lijngrafieken, enz.

Kijkt naar statistische data, grafieken en diagrammen

Enquètegegevens analyseren in Python

Centrale tendens: gemiddelde, mediaan, modus

  • Één waarde die het midden van de verdeling weergeeft
  • Gemiddelde = rekenkundig gemiddelde
  • Mediaan = middelste waarde na sorteren
  • Modus = meest voorkomende waarde
Enquètegegevens analyseren in Python

Maten van spreiding

  • Bepaalt hoe ver data van het midden afligt
  • Spreiding
    • Afstand tussen hoogste en laagste waarde
  • Standaardafwijking
    • Gemiddelde variatie
    • Inzicht in afstand tussen een waarde en het gemiddelde

Mensenmassa van boven die een groeigrafiek vormt met lijnen ertussen

Enquètegegevens analyseren in Python

Enquête: dietary_habits

dietary_habits.head()
| Age   | Gender | meals_per_day | eat_out_per_wk |
|-------|--------|---------------|----------------|
| 18-24 | Male   |             5 |              4 |
| 18-24 | Male   |             4 |              1 |
| 45-54 | Male   |             3 |              3 |
| 18-24 | Male   |             2 |              1 |
| 18-24 | Female |             3 |              1 |
Enquètegegevens analyseren in Python

Frequentieverdeling: dietary_habits

dietary_habits.Gender.value_counts().to_frame("Number")
|        | Number |
|--------|--------|
| Male   | 40     |
| Female | 38     |

Index: Gender

Enquètegegevens analyseren in Python

Frequentieverdeling: dietary_habits

dietary_habits.Gender.value_counts().to_frame("Number").plot(kind='bar')

staafdiagram van geslachtsfrequenties

Enquètegegevens analyseren in Python

Maten van centrale tendens: dietary_habits

  • .mean()
  • .median()
  • .mode()
Enquètegegevens analyseren in Python

Maten van centrale tendens: dietary_habits

  • .mean()
dietary_habits.mean()
| meals_per_day  | 3.128205 |
| eat_out_per_wk | 1.897436 |
| dtype: float64 |          |
Enquètegegevens analyseren in Python

Maten van centrale tendens: dietary_habits

  • .median()
dietary_habits.median()
| meals_per_day  | 3.0 |
| eat_out_per_wk | 1.5 |
| dtype: float64 |     |
Enquètegegevens analyseren in Python

Maten van centrale tendens: dietary_habits

  • .mode()
dietary_habits.mode()
| Age   | Gender | meals_per_day | eat_out_per_wk |
|-------|--------|---------------|----------------|
| 18-24 | Male   |             3 |              1 |
Enquètegegevens analyseren in Python

Maten van spreiding: dietary_habits

print(dietary_habits.meals_per_day.max() - dietary_habits.meals_per_day.min())
3
print(dietary_habits.meals_per_day.std())
0.6518500018473766
Enquètegegevens analyseren in Python

Laten we oefenen!

Enquètegegevens analyseren in Python

Preparing Video For Download...