Discrete verdelingen

Inleiding tot statistiek in Python

Maggie Matsui

Content Developer, DataCamp

Met de dobbelsteen gooien

Zeszijdige dobbelsteen

Inleiding tot statistiek in Python

Met de dobbelsteen gooien

Elke zijde heeft kans 1/6

Inleiding tot statistiek in Python

Verkopers kiezen

 

Namen in een doos, elk met 25% kans

Inleiding tot statistiek in Python

Kansverdeling

Beschrijft de kans van elke mogelijke uitkomst in een scenario

Elke zijde heeft kans 1/6

 

Verwachte waarde: gemiddelde van een kansverdeling

Verwachte waarde van een eerlijke worp = $(1 \times \frac{1}{6}) + (2 \times \frac{1}{6}) +(3 \times \frac{1}{6}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3{,}5$

Inleiding tot statistiek in Python

Een kansverdeling visualiseren

Staafdiagram met een staaf voor 1 t/m 6, hoogte 1/6.

Inleiding tot statistiek in Python

Kans = oppervlakte

$$P(\text{dobbelsteenworp}) \le 2 = ~?$$

Balken voor 1 en 2 gemarkeerd

Inleiding tot statistiek in Python

Kans = oppervlakte

$$P(\text{dobbelsteenworp}) \le 2 = 1/3$$

1/6 + 1/6 = 1/3

Inleiding tot statistiek in Python

Oneerlijke dobbelsteen

zeszijdige dobbelsteen met twee zijden met 3 stippen

Verwachte waarde van oneerlijke worp = $(1 \times \frac{1}{6}) +(2 \times 0) +(3 \times \frac{1}{3}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3{,}67$

Inleiding tot statistiek in Python

Oneerlijke kansen visualiseren

Kansverdeling van oneerlijke dobbelsteen. Balken voor 1, 4, 5, 6 hoogte 1/6, balk voor 2 hoogte 0, balk voor 3 hoogte 1/3

Inleiding tot statistiek in Python

Oppervlaktes optellen

$$P(\text{oneerlijke worp}) \le 2 = ~?$$

1/6 + 0

Inleiding tot statistiek in Python

Oppervlaktes optellen

$$P(\text{oneerlijke worp}) \le 2 = 1/6$$

1/6 + 0

Inleiding tot statistiek in Python

Discrete kansverdelingen

Beschrijf kansen voor discrete uitkomsten

Eerlijke dobbelsteen

Plot eerlijke dobbelsteen

                 Discrete uniforme verdeling

 

Oneerlijke dobbelsteen

Plot oneerlijke dobbelsteen

Inleiding tot statistiek in Python

Steekproeven uit discrete verdelingen

print(die)
  number      prob
0      1  0.166667
1      2  0.166667
2      3  0.166667
3      4  0.166667
4      5  0.166667
5      6  0.166667
np.mean(die['number'])
3.5
rolls_10 = die.sample(10, replace = True)
rolls_10
  number      prob
0      1  0.166667
0      1  0.166667
4      5  0.166667
1      2  0.166667
0      1  0.166667
0      1  0.166667
5      6  0.166667
5      6  0.166667
...
Inleiding tot statistiek in Python

Een steekproef visualiseren

rolls_10['number'].hist(bins=np.linspace(1,7,7)) 
plt.show()

histogram van 10 worpen

Inleiding tot statistiek in Python

Steekproefverdeling vs. theoretische verdeling

Steekproef van 10 worpen

histogram van 10 worpen

np.mean(rolls_10['number']) = 3.0

Theoretische kansverdeling

 

kansverdeling van eerlijke dobbelsteen

mean(die['number']) = 3.5

Inleiding tot statistiek in Python

Een grotere steekproef

Steekproef van 100 worpen

histogram van 100 worpen

np.mean(rolls_100['number']) = 3.4

Theoretische kansverdeling

 

kansverdeling van eerlijke dobbelsteen

mean(die['number']) = 3.5

Inleiding tot statistiek in Python

Een nog grotere steekproef

Steekproef van 1000 worpen

histogram van 1000 worpen

np.mean(rolls_1000['number']) = 3.48

Theoretische kansverdeling

 

kansverdeling van eerlijke dobbelsteen

mean(die['number']) = 3.5

Inleiding tot statistiek in Python

Grote-getallenwet

Als je steekproef groter wordt, nadert het steekproefgemiddelde de verwachte waarde.

Steekproefgrootte Gemiddelde
10 3.00
100 3.40
1000 3.48
Inleiding tot statistiek in Python

Laten we oefenen!

Inleiding tot statistiek in Python

Preparing Video For Download...