Wat zijn de kansen?

Inleiding tot statistiek in Python

Maggie Matsui

Content Developer, DataCamp

Kans meten

Wat is de kans op een gebeurtenis?

$$ P(\text{event}) = \frac{\text{\# manieren waarop de gebeurtenis kan optreden}}{\text{totaal aantal mogelijke uitkomsten}} $$

Voorbeeld: muntworp

$$ P(\text{kop}) = \frac{\text{1 manier om kop te krijgen}}{\text{2 mogelijke uitkomsten}} = \frac{1}{2} = 50\%$$

Getallenlijn van kans. 0 procent = onmogelijk, 100 procent = gebeurt zeker

Inleiding tot statistiek in Python

Verkopers toewijzen

Doos met de namen van Amir, Brian, Claire en Damian

Inleiding tot statistiek in Python

Verkopers toewijzen

Brians naam wordt getrokken

$$P(\text{Brian}) = \frac{1}{4} = 25\%$$

Inleiding tot statistiek in Python

Steekproeven uit een DataFrame

print(sales_counts)
     name  n_sales
0    Amir      178
1   Brian      128
2  Claire       75
3  Damian       69
sales_counts.sample()
    name  n_sales
1  Brian      128
sales_counts.sample()
     name  n_sales
2  Claire       75
Inleiding tot statistiek in Python

Een willekeurige seed instellen

np.random.seed(10)

sales_counts.sample()
    name  n_sales
1  Brian      128
np.random.seed(10)
sales_counts.sample()
    name  n_sales
1  Brian      128
np.random.seed(10)
sales_counts.sample()
    name  n_sales
1  Brian      128
Inleiding tot statistiek in Python

Een tweede meeting

Steekproef zonder teruglegging

Doos met Amir, Claire, Damian

Inleiding tot statistiek in Python

Een tweede meeting

Naam van Claire getrokken

$$P(\text{Claire}) = \frac{1}{3} = 33\%$$

Inleiding tot statistiek in Python

Twee keer steekproeven in Python

sales_counts.sample(2)
     name  n_sales
1   Brian      128
2  Claire       75
Inleiding tot statistiek in Python

Steekproef met teruglegging

GIF van hand die in doos grijpt, Brians naam pakt en teruglegt

Inleiding tot statistiek in Python

Steekproef met teruglegging

Screen Shot 2020-04-28 at 5.21.54 PM.png

$$P(\text{Claire}) = \frac{1}{4} = 25\%$$

Inleiding tot statistiek in Python

Steekproef met/zonder teruglegging in Python

sales_counts.sample(5, replace = True)
     name  n_sales
1   Brian      128
2  Claire       75
1   Brian      128
3  Damian       69
0    Amir      178
Inleiding tot statistiek in Python

Onafhankelijke gebeurtenissen

Twee gebeurtenissen zijn onafhankelijk als de kans op de tweede niet wordt beïnvloed door de uitkomst van de eerste.

Twee kolommen: eerste trekking met Amir, Brian, Claire, Damian. Tweede trekking is leeg

Inleiding tot statistiek in Python

Onafhankelijke gebeurtenissen

Twee gebeurtenissen zijn onafhankelijk als de kans op de tweede niet wordt beïnvloed door de uitkomst van de eerste.

 

Steekproef met teruglegging = elke trekking is onafhankelijk

Pijlen van elke naam in eerste kolom wijzen naar Claire in tweede kolom, met kans 25%

Inleiding tot statistiek in Python

Afhankelijke gebeurtenissen

Twee gebeurtenissen zijn afhankelijk als de kans op de tweede wel wordt beïnvloed door de uitkomst van de eerste.

Twee kolommen: eerste trekking met Amir, Brian, Claire, Damian. Tweede trekking is leeg

Inleiding tot statistiek in Python

Afhankelijke gebeurtenissen

Twee gebeurtenissen zijn afhankelijk als de kans op de tweede wel wordt beïnvloed door de uitkomst van de eerste.

Claire in eerste kolom wijst naar Claire in tweede kolom met kans 0%

Inleiding tot statistiek in Python

Afhankelijke gebeurtenissen

Twee gebeurtenissen zijn afhankelijk als de kans op de tweede wel wordt beïnvloed door de uitkomst van de eerste.

 

Steekproef zonder teruglegging → trekkingen worden afhankelijk

Amir, Brian en Damian in eerste kolom wijzen naar Claire in tweede kolom met kans 33%

Inleiding tot statistiek in Python

Laten we oefenen!

Inleiding tot statistiek in Python

Preparing Video For Download...