Quali sono le probabilità?

Introduzione alla statistica in R

Maggie Matsui

Content Developer, DataCamp

Misurare la probabilità

Qual è la probabilità di un evento?

$$ P(\text{evento}) = \frac{\text{\# modi in cui l'evento può accadere}}{\text{\# totale di esiti possibili}} $$

Esempio: lancio di una moneta

$$ P(\text{testa}) = \frac{\text{1 modo per ottenere testa}}{\text{2 esiti possibili}} = \frac{1}{2} = 50\%$$

Linea dei numeri della probabilità. 0 percento = impossibile, 100 percento = certo

Introduzione alla statistica in R

Assegnare i venditori

Scatola con i nomi di Amir, Brian, Claire e Damian

Introduzione alla statistica in R

Assegnare i venditori

Estrazione del nome di Brian

$$P(\text{Brian}) = \frac{1}{4} = 25\%$$

Introduzione alla statistica in R

Campionare da un data frame

sales_counts
   name  n_sales
 1 Amir      178
 2 Brian     126
 3 Claire     75
 4 Damian     69
sales_counts %>%
  sample_n(1)
   name  n_sales
 1 Brian     126
sales_counts %>%
  sample_n(1)
   name  n_sales
 1 Claire     75
Introduzione alla statistica in R

Impostare un seed casuale

set.seed(5)

sales_counts %>% sample_n(1)
   name  n_sales
 1 Brian     126
set.seed(5)

sales_counts %>% sample_n(1)
   name  n_sales
 1 Brian     126
Introduzione alla statistica in R

Un secondo incontro

Campionamento senza reinserimento

Scatola con Amir, Claire, Damian

Introduzione alla statistica in R

Un secondo incontro

Estratto il nome di Claire

$$P(\text{Claire}) = \frac{1}{3} = 33\%$$

Introduzione alla statistica in R

Campionare due volte in R

sales_counts %>%
  sample_n(2)
   name  n_sales
 1 Brian     126
 2 Claire     75
Introduzione alla statistica in R

Campionamento con reinserimento

GIF di una mano che entra nella scatola, estrae Brian e poi lo rimette

Introduzione alla statistica in R

Campionamento con reinserimento

Schermata 28-04-2020 alle 17.21.54

$$P(\text{Claire}) = \frac{1}{4} = 25\%$$

Introduzione alla statistica in R

Campionamento con reinserimento in R

sales_counts %>%
  sample_n(2, replace = TRUE)
   name  n_sales
 1 Brian     126
 2 Claire     75

5 incontri:

sample(sales_team, 5, replace = TRUE)
   name  n_sales
 1 Brian     126
 2 Claire     75
 3 Brian     126
 4 Brian     126
 5 Amir      178
Introduzione alla statistica in R

Eventi indipendenti

Due eventi sono indipendenti se la probabilità del secondo non è influenzata dall'esito del primo.

Due colonne: la prima con Amir, Brian, Claire, Damian. La seconda è vuota

Introduzione alla statistica in R

Eventi indipendenti

Due eventi sono indipendenti se la probabilità del secondo non è influenzata dall'esito del primo.

 

Campionare con reinserimento = ogni estrazione è indipendente

Frecce da ogni nome nella prima colonna verso Claire nella seconda, con probabilità 25%

Introduzione alla statistica in R

Eventi dipendenti

Due eventi sono dipendenti se la probabilità del secondo è influenzata dall'esito del primo.

Due colonne: la prima con Amir, Brian, Claire, Damian. La seconda è vuota

Introduzione alla statistica in R

Eventi dipendenti

Due eventi sono dipendenti se la probabilità del secondo è influenzata dall'esito del primo.

Claire nella prima colonna punta a Claire nella seconda con probabilità 0%

Introduzione alla statistica in R

Eventi dipendenti

Due eventi sono dipendenti se la probabilità del secondo è influenzata dall'esito del primo.

 

Campionare senza reinserimento = ogni estrazione è dipendente

Amir, Brian e Damian nella prima colonna puntano a Claire nella seconda con probabilità 33%

Introduzione alla statistica in R

Passons à la pratique !

Introduzione alla statistica in R

Preparing Video For Download...