Discrete verdelingen

Inleiding tot statistiek in Python

Maggie Matsui

Content Developer, DataCamp

Met de dobbelsteen gooien

Zeszijdige dobbelsteen

Met de dobbelsteen gooien

Elke zijde heeft kans 1/6

Verkopers kiezen

Namen in een doos, elk met 25% kans

Kansverdeling

Beschrijft de kans van elke mogelijke uitkomst in een scenario

Elke zijde heeft kans 1/6

Verwachte waarde: gemiddelde van een kansverdeling

Verwachte waarde van een eerlijke worp = $(1 \times \frac{1}{6}) + (2 \times \frac{1}{6}) +(3 \times \frac{1}{6}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3{,}5$

Een kansverdeling visualiseren

Staafdiagram met een staaf voor 1 t/m 6, hoogte 1/6.

Kans = oppervlakte

$$P(\text{dobbelsteenworp}) \le 2 = ~?$$

Balken voor 1 en 2 gemarkeerd

Kans = oppervlakte

$$P(\text{dobbelsteenworp}) \le 2 = 1/3$$

1/6 + 1/6 = 1/3

Oneerlijke dobbelsteen

zeszijdige dobbelsteen met twee zijden met 3 stippen

Verwachte waarde van oneerlijke worp = $(1 \times \frac{1}{6}) +(2 \times 0) +(3 \times \frac{1}{3}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3{,}67$

Oneerlijke kansen visualiseren

Kansverdeling van oneerlijke dobbelsteen. Balken voor 1, 4, 5, 6 hoogte 1/6, balk voor 2 hoogte 0, balk voor 3 hoogte 1/3

Oppervlaktes optellen

$$P(\text{oneerlijke worp}) \le 2 = ~?$$

1/6 + 0

Oppervlaktes optellen

$$P(\text{oneerlijke worp}) \le 2 = 1/6$$

1/6 + 0

Discrete kansverdelingen

Beschrijf kansen voor discrete uitkomsten

Eerlijke dobbelsteen

Plot eerlijke dobbelsteen

Discrete uniforme verdeling

Oneerlijke dobbelsteen

Plot oneerlijke dobbelsteen

Steekproeven uit discrete verdelingen

print(die)

  number      prob
0      1  0.166667
1      2  0.166667
2      3  0.166667
3      4  0.166667
4      5  0.166667
5      6  0.166667

np.mean(die['number'])

3.5

rolls_10 = die.sample(10, replace = True)
rolls_10

  number      prob
0      1  0.166667
0      1  0.166667
4      5  0.166667
1      2  0.166667
0      1  0.166667
0      1  0.166667
5      6  0.166667
5      6  0.166667
...

Een steekproef visualiseren

rolls_10['number'].hist(bins=np.linspace(1,7,7)) 
plt.show()

histogram van 10 worpen

Steekproefverdeling vs. theoretische verdeling

Steekproef van 10 worpen

histogram van 10 worpen

np.mean(rolls_10['number']) = 3.0

Theoretische kansverdeling

kansverdeling van eerlijke dobbelsteen

mean(die['number']) = 3.5

Een grotere steekproef

Steekproef van 100 worpen

histogram van 100 worpen

np.mean(rolls_100['number']) = 3.4

Theoretische kansverdeling

kansverdeling van eerlijke dobbelsteen

mean(die['number']) = 3.5

Een nog grotere steekproef

Steekproef van 1000 worpen

histogram van 1000 worpen

np.mean(rolls_1000['number']) = 3.48

Theoretische kansverdeling

kansverdeling van eerlijke dobbelsteen

mean(die['number']) = 3.5

Grote-getallenwet

Als je steekproef groter wordt, nadert het steekproefgemiddelde de verwachte waarde.

Steekproefgrootte	Gemiddelde
10	3.00
100	3.40
1000	3.48

Laten we oefenen!

Inleiding tot statistiek in Python