Correlaties

Enquètegegevens analyseren in Python

EbunOluwa Andrew

Data Scientist

Correlaties in enquête-analyse

  • Wederzijdse afhankelijkheid van variabelen
    • Als de ene verandert, verandert de andere mee
  • Meet de lineaire relatie tussen twee enquête-items
  • Correlatie is GEEN causaliteit
    • Mogelijke derde beïnvloedende variabele
    • Niet te bepalen welke variabele de ander veroorzaakt

Correlatie is geen causaliteit. Typografie

Enquètegegevens analyseren in Python

Sterkte en richting van correlatie

  • Correlatiecoëfficiënten → ‘r’
  • -1,0 tot 1,0
    • -1 of 1 = perfecte relatie
    • 0 = geen relatie
    • < 0 = negatieve relatie
    • 0 = positieve relatie

  • Bij kleine steekproeven is een sterkere correlatie nodig voor significantie

Correlatie tussen puzzelstukjes

Enquètegegevens analyseren in Python

.corr()-functie

  • .corr()
  • _eerste kolom_.corr(_tweede kolom_)

Typen correlatie

Enquètegegevens analyseren in Python

.corr()-voorbeeld: healthy_city

| City       | Rank | Life expectancy_years | Happiness levels |
|------------|------|-----------------------|------------------|
| Amsterdam  |    1 |                  81.2 |             7.44 |
| Sydney     |    2 |                  82.1 |             7.22 |
| Vienna     |    3 |                    81 |             7.29 |
| Stockholm  |    4 |                  81.8 |             7.35 |
| Copenhagen |    5 |                  79.8 |             7.64 |
| Helsinki   |    6 |                  80.4 |              7.8 |
| Fukuoka    |    7 |                  83.2 |             5.87 |
| Berlin     |    8 |                  80.6 |             7.07 |
| Barcelona  |    9 |                  82.2 |              6.4 |
Enquètegegevens analyseren in Python

.corr()-voorbeeld: healthy_city

import matplotlib.pyplot as plt
plt.scatter(healthy_city['Life expectancy_years'],
            healthy_city['Happiness levels'])

happy_survey-spreidingsdiagram

Enquètegegevens analyseren in Python

.corr()-voorbeeld: healthy_city

happy_survey['Happiness levels'].corr(
  happy_survey['Life expectancy_years'])
0.7245870841569987
Enquètegegevens analyseren in Python

Laten we oefenen!

Enquètegegevens analyseren in Python

Preparing Video For Download...