Beschrijf de verdeling met kwantielen

Financiële data importeren en beheren in Python

Stefan Jansen

Instructor

Verdelingen beschrijven

  • Eerste blik: centrum en standaardafwijking
  • Hoe krijg je een gedetailleerder beeld van de verdeling?
  • Kwantielen berekenen en plotten
Financiële data importeren en beheren in Python

Meer spreiding: kwantielen

  • Kwantielen: groepen met evenveel observaties
    • Kwartielen: 4 groepen, elk 25%
    • Decielen: 10 groepen, elk 10%
    • Interkwartielafstand: 3e kwartiel - 1e kwartiel

kwantiel.png

Financiële data importeren en beheren in Python

Kwantielen met pandas

market_cap = nasdaq['Market Capitalization'].div(10**6) 
median = market_cap.quantile(.5)

median == market_cap.median()
True
quantiles = market_cap.quantile([.25, .75])
0.25     43.375930
0.75    969.905207
quantiles[.75] - quantiles[.25] # Interkwartielafstand
926.5292771575
Financiële data importeren en beheren in Python

Kwantielen met pandas & numpy

deciles = np.arange(start=.1, stop=.91, step=.1)
deciles
array([ 0.1,  0.2,  0.3,  0.4,  ..., 0.7,  0.8,  0.9])
market_cap.quantile(deciles)
0.1       4.884565
0.2      26.993382
0.3      65.714547
0.4     124.320644
0.5     225.968428
0.6     402.469678
...
Financiële data importeren en beheren in Python

Kwantielen visualiseren met staafdiagram

title = 'NASDAQ Market Capitalization (million USD)'
market_cap.quantile(deciles).plot(kind='bar', title=title)
plt.tight_layout(); plt.show()

kwantiel_balk.png

Financiële data importeren en beheren in Python

Alle statistieken in één keer

market_cap.describe()
count      3167.000000
mean       3180.712621
std       25471.038707
min           0.000000
25%          43.375930  # 1e kwantiel
50%         225.968428  # Mediaan
75%         969.905207  # 3e kwantiel
max      740024.467000
Name: Market Capitalization
Financiële data importeren en beheren in Python

Alle statistieken in één keer

market_cap.describe(percentiles=np.arange(.1, .91, .1))
count      3167.000000
mean       3180.712621
std       25471.038707
min           0.000000
10%           4.884565
20%          26.993382
30%          65.714547
40%         124.320644
50%         225.968428
60%         402.469678
70%         723.163197
80%        1441.071134
...
Financiële data importeren en beheren in Python

Laten we oefenen!

Financiële data importeren en beheren in Python

Preparing Video For Download...