Inleiding tot statistiek in R
Maggie Matsui
Content Developer, DataCamp
Wat is de kans op een gebeurtenis?
$$ P(\text{event}) = \frac{\text{\# manieren waarop event kan gebeuren}}{\text{totaal \# mogelijke uitkomsten}} $$
Voorbeeld: een muntworp
$$ P(\text{kop}) = \frac{\text{1 manier om kop te krijgen}}{\text{2 mogelijke uitkomsten}} = \frac{1}{2} = 50\%$$



$$P(\text{Brian}) = \frac{1}{4} = 25\%$$
sales_counts
name n_sales
1 Amir 178
2 Brian 126
3 Claire 75
4 Damian 69
sales_counts %>%
sample_n(1)
name n_sales
1 Brian 126
sales_counts %>%
sample_n(1)
name n_sales
1 Claire 75
set.seed(5)sales_counts %>% sample_n(1)
name n_sales
1 Brian 126
set.seed(5)sales_counts %>% sample_n(1)
name n_sales
1 Brian 126
Steekproef zonder terugleggen


$$P(\text{Claire}) = \frac{1}{3} = 33\%$$
sales_counts %>%
sample_n(2)
name n_sales
1 Brian 126
2 Claire 75


$$P(\text{Claire}) = \frac{1}{4} = 25\%$$
sales_counts %>%
sample_n(2, replace = TRUE)
name n_sales
1 Brian 126
2 Claire 75
5 gesprekken:
sample(sales_team, 5, replace = TRUE)
name n_sales
1 Brian 126
2 Claire 75
3 Brian 126
4 Brian 126
5 Amir 178
Twee gebeurtenissen zijn onafhankelijk als de kans op de tweede niet wordt beïnvloed door de uitkomst van de eerste.

Twee gebeurtenissen zijn onafhankelijk als de kans op de tweede niet wordt beïnvloed door de uitkomst van de eerste.
Steekproef met terugleggen = elke trekking is onafhankelijk

Twee gebeurtenissen zijn afhankelijk als de kans op de tweede wel wordt beïnvloed door de uitkomst van de eerste.

Twee gebeurtenissen zijn afhankelijk als de kans op de tweede wel wordt beïnvloed door de uitkomst van de eerste.

Twee gebeurtenissen zijn afhankelijk als de kans op de tweede wel wordt beïnvloed door de uitkomst van de eerste.
Steekproef zonder terugleggen = elke trekking is afhankelijk

Inleiding tot statistiek in R