Introductie tot Exploratory Data Analysis

Statistisch denken in Python (deel 1)

Justin Bois

Teaching Professor at the California Institute of Technology

Exploratory Data Analysis

  • Het proces van ordenen, plotten en samenvatten van een dataset
Statistisch denken in Python (deel 1)

 

“Exploratory data analysis vertelt nooit het hele verhaal, maar niets anders kan als fundament dienen.” —John Tukey

Statistisch denken in Python (deel 1)

Verkiezingsuitslagen swing states VS, 2008

ch1-1.006.png

1 Gegevens afkomstig van Data.gov (https://www.data.gov/)
Statistisch denken in Python (deel 1)

Verkiezingsuitslagen swing states VS, 2008

import pandas as pd
df_swing = pd.read_csv('2008_swing_states.csv')
df_swing[['state', 'county', 'dem_share']]
    state              county  dem_share
0      PA         Erie County      60.08
1      PA     Bradford County      40.64
2      PA        Tioga County      36.07
3      PA       McKean County      41.21
4      PA       Potter County      31.04
5      PA        Wayne County      43.78
6      PA  Susquehanna County      44.08
7      PA       Warren County      46.85
8      OH    Ashtabula County      56.94
1 Gegevens afkomstig van Data.gov (https://www.data.gov/)
Statistisch denken in Python (deel 1)

Verkiezingsuitslagen swing states VS, 2008

ch1-1.009.png

1 Gegevens afkomstig van Data.gov (https://www.data.gov/)
Statistisch denken in Python (deel 1)

Laten we oefenen!

Statistisch denken in Python (deel 1)

Preparing Video For Download...