Wat zijn de kansen?

Inleiding tot statistiek in Python

Maggie Matsui

Content Developer, DataCamp

Kans meten

Wat is de kans op een gebeurtenis?

$$ P(\text{event}) = \frac{\text{\# manieren waarop de gebeurtenis kan optreden}}{\text{totaal aantal mogelijke uitkomsten}} $$

Voorbeeld: muntworp

$$ P(\text{kop}) = \frac{\text{1 manier om kop te krijgen}}{\text{2 mogelijke uitkomsten}} = \frac{1}{2} = 50\%$$

Getallenlijn van kans. 0 procent = onmogelijk, 100 procent = gebeurt zeker

Doos met de namen van Amir, Brian, Claire en Damian

Brians naam wordt getrokken

$$P(\text{Brian}) = \frac{1}{4} = 25\%$$

print(sales_counts)

     name  n_sales
0    Amir      178
1   Brian      128
2  Claire       75
3  Damian       69

sales_counts.sample()

    name  n_sales
1  Brian      128

sales_counts.sample()

     name  n_sales
2  Claire       75

np.random.seed(10)

sales_counts.sample()

    name  n_sales
1  Brian      128

np.random.seed(10)
sales_counts.sample()

    name  n_sales
1  Brian      128

np.random.seed(10)
sales_counts.sample()

    name  n_sales
1  Brian      128

Steekproef zonder teruglegging

Doos met Amir, Claire, Damian

Naam van Claire getrokken

$$P(\text{Claire}) = \frac{1}{3} = 33\%$$

sales_counts.sample(2)

     name  n_sales
1   Brian      128
2  Claire       75

GIF van hand die in doos grijpt, Brians naam pakt en teruglegt

Screen Shot 2020-04-28 at 5.21.54 PM.png

$$P(\text{Claire}) = \frac{1}{4} = 25\%$$

sales_counts.sample(5, replace = True)

     name  n_sales
1   Brian      128
2  Claire       75
1   Brian      128
3  Damian       69
0    Amir      178

Twee gebeurtenissen zijn onafhankelijk als de kans op de tweede niet wordt beïnvloed door de uitkomst van de eerste.

Twee kolommen: eerste trekking met Amir, Brian, Claire, Damian. Tweede trekking is leeg

Twee gebeurtenissen zijn onafhankelijk als de kans op de tweede niet wordt beïnvloed door de uitkomst van de eerste.

Steekproef met teruglegging = elke trekking is onafhankelijk

Pijlen van elke naam in eerste kolom wijzen naar Claire in tweede kolom, met kans 25%

Twee gebeurtenissen zijn afhankelijk als de kans op de tweede wel wordt beïnvloed door de uitkomst van de eerste.

Twee kolommen: eerste trekking met Amir, Brian, Claire, Damian. Tweede trekking is leeg

Twee gebeurtenissen zijn afhankelijk als de kans op de tweede wel wordt beïnvloed door de uitkomst van de eerste.

Claire in eerste kolom wijst naar Claire in tweede kolom met kans 0%

Twee gebeurtenissen zijn afhankelijk als de kans op de tweede wel wordt beïnvloed door de uitkomst van de eerste.

Steekproef zonder teruglegging → trekkingen worden afhankelijk

Amir, Brian en Damian in eerste kolom wijzen naar Claire in tweede kolom met kans 33%

Inleiding tot statistiek in Python