Discrete verdelingen

Inleiding tot statistiek in R

Maggie Matsui

Content Developer, DataCamp

Met de dobbelsteen gooien

Zeszijdige dobbelsteen

Inleiding tot statistiek in R

Met de dobbelsteen gooien

Elke zijde heeft kans 1/6

Inleiding tot statistiek in R

Verkopers selecteren

 

Namen in een bak, elk met 25% kans

Inleiding tot statistiek in R

Kansverdeling

Beschrijft de kans van elke mogelijke uitkomst in een scenario

Elke zijde heeft kans 1/6

 

Verwachtingswaarde: gemiddelde van een kansverdeling

Verwachtingswaarde van een eerlijke worp = $(1 \times \frac{1}{6}) + (2 \times \frac{1}{6}) +(3 \times \frac{1}{6}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3{,}5$

Inleiding tot statistiek in R

Een kansverdeling visualiseren

Staafdiagram met een balk voor elk getal 1 t/m 6, hoogte 1/6.

Inleiding tot statistiek in R

Kans = oppervlakte

$$P(\text{worp}) \le 2 = ~?$$

Balken voor 1 en 2 gemarkeerd

Inleiding tot statistiek in R

Kans = oppervlakte

$$P(\text{worp}) \le 2 = 1/3$$

1/6 + 1/6 = 1/3

Inleiding tot statistiek in R

Oneerlijke dobbelsteen

zeszijdige dobbelsteen met twee zijden met 3 stippen

Verwachtingswaarde van oneerlijke worp = $(1 \times \frac{1}{6}) +(2 \times 0) +(3 \times \frac{1}{3}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3{,}67$

Inleiding tot statistiek in R

Oneerlijke kansen visualiseren

Kansverdeling van oneerlijke dobbelsteen. Balken voor 1, 4, 5, 6 hoogte 1/6, balk voor 2 hoogte 0, balk voor 3 hoogte 1/3

Inleiding tot statistiek in R

Oppervlaktes optellen

$$P(\text{oneerlijke worp}) \le 2 = ~?$$

1/6 + 0

Inleiding tot statistiek in R

Oppervlaktes optellen

$$P(\text{oneerlijke worp}) \le 2 = 1/6$$

1/6 + 0

Inleiding tot statistiek in R

Discrete kansverdelingen

Beschrijf kansen voor discrete uitkomsten

Eerlijke dobbelsteen

die_plot.png

                           Discrete uniforme verdeling

 

Oneerlijke dobbelsteen

uneven_die.png

Inleiding tot statistiek in R

Steekproeven uit discrete verdelingen

die
   n
1  1
2  2
3  3
4  4
5  5
6  6
mean(die$n)
3.5
rolls_10 <- die %>%
  sample_n(10, replace = TRUE)
rolls_10
   n
1  1
2  1
3  5
4  2
5  1
6  1
7  6
8  6
...
Inleiding tot statistiek in R

Een steekproef visualiseren

ggplot(rolls_10, aes(n)) +
  geom_histogram(bins = 6)

histogram van 10 worpen

Inleiding tot statistiek in R

Steekproefverdeling vs. theoretische verdeling

 

Steekproef van 10 worpen

histogram van 10 worpen

mean(rolls_10$n) = 3.0

 

Theoretische kansverdeling

kansverdeling van een eerlijke dobbelsteen

mean(die$n) = 3.5

Inleiding tot statistiek in R

Een grotere steekproef

 

Steekproef van 100 worpen

histogram van 100 worpen

mean(rolls_100$n) = 3.36

 

Theoretische kansverdeling

kansverdeling van een eerlijke dobbelsteen

mean(die$n) = 3.5

Inleiding tot statistiek in R

Een nog grotere steekproef

 

Steekproef van 1000 worpen

histogram van 1000 worpen

mean(rolls_1000$n) = 3.53

 

Theoretische kansverdeling

kansverdeling van een eerlijke dobbelsteen

mean(die$n) = 3.5

Inleiding tot statistiek in R

Wet van de grote aantallen

Als je steekproef groter wordt, nadert het steekproefgemiddelde de verwachtingswaarde.

Steekproefgrootte Gemiddelde
10 3.00
100 3.36
1000 3.53
Inleiding tot statistiek in R

Laten we oefenen!

Inleiding tot statistiek in R

Preparing Video For Download...