Quali sono le possibilità?

Introduzione alle statistiche in R

Misurare le probabilità

Qual è la probabilità di un evento?

$$ P(\text{event}) = \frac{\text{\# ways event can happen}}{\text{total \# of possible outcomes}} $$

Esempio: lancio di una moneta

$$ P(\text{heads}) = \frac{\text{1 way to get heads}}{\text{2 possible outcomes}} = \frac{1}{2} = 50\%$$

Linea numerica della probabilità. 0 per cento = impossibile, 100 per cento = accadrà sicuramente

Introduzione alle statistiche in R

Assegnare i venditori

Casella con i nomi di Amir, Brian, Claire e Damian

Introduzione alle statistiche in R

Assegnare i venditori

Estrarre il nome di Brian

$$P(\text{Brian}) = \frac{1}{4} = 25\%$$

Introduzione alle statistiche in R

Campionamento da un frame di dati

sales_counts
   name  n_sales
 1 Amir      178
 2 Brian     126
 3 Claire     75
 4 Damian     69
sales_counts %>%
  sample_n(1)
   name  n_sales
 1 Brian     126
sales_counts %>%
  sample_n(1)
   name  n_sales
 1 Claire     75
Introduzione alle statistiche in R

Impostazione di un seme casuale

set.seed(5)

sales_counts %>% sample_n(1)
   name  n_sales
 1 Brian     126
set.seed(5)

sales_counts %>% sample_n(1)
   name  n_sales
 1 Brian     126
Introduzione alle statistiche in R

Un secondo incontro

Campionamento senza sostituzione

Box con Amir, Claire, Damian

Introduzione alle statistiche in R

Un secondo incontro

Il nome di Claire è stato estratto

$$P(\text{Claire}) = \frac{1}{3} = 33\%$$

Introduzione alle statistiche in R

Campionamento doppio in R

sales_counts %>%
  sample_n(2)
   name  n_sales
 1 Brian     126
 2 Claire     75
Introduzione alle statistiche in R

Campionamento con sostituzione

GIF della mano che entra nella scatola, estrae il nome di Brian e lo rimette dentro

Introduzione alle statistiche in R

Campionamento con sostituzione

Screen Shot 2020-04-28 at 5.21.54 PM.png

$$P(\text{Claire}) = \frac{1}{4} = 25\%$$

Introduzione alle statistiche in R

Campionamento con sostituzione in R

sales_counts %>%
  sample_n(2, replace = TRUE)
   name  n_sales
 1 Brian     126
 2 Claire     75

5 incontri:

sample(sales_team, 5, replace = TRUE)
   name  n_sales
 1 Brian     126
 2 Claire     75
 3 Brian     126
 4 Brian     126
 5 Amir      178
Introduzione alle statistiche in R

Eventi indipendenti

Due eventi sono indipendenti se la probabilità del secondo evento non è influenzata dall'esito del primo.

Due colonne: Colonna di prima scelta contenente Amir, Brian, Claire, Damian. La seconda colonna di scelta è vuota

Introduzione alle statistiche in R

Eventi indipendenti

Due eventi sono indipendenti se la probabilità del secondo evento non è influenzata dall'esito del primo.

 

Campionamento con sostituzione = ogni prelievo è indipendente

Le frecce da ogni nome nella prima colonna di scelta puntano a Claire nella seconda colonna di scelta, con una probabilità del 25%

Introduzione alle statistiche in R

Eventi dipendenti

Due eventi sono dipendenti se la probabilità del secondo evento è influenzata dall'esito del primo.

Due colonne: Colonna di prima scelta contenente Amir, Brian, Claire, Damian. La seconda colonna di scelta è vuota

Introduzione alle statistiche in R

Eventi dipendenti

Due eventi sono dipendenti se la probabilità del secondo evento è influenzata dall'esito del primo.

Claire nella prima colonna punta a Claire nella seconda colonna con probabilità 0%

Introduzione alle statistiche in R

Eventi dipendenti

Due eventi sono dipendenti se la probabilità del secondo evento è influenzata dall'esito del primo.

 

Campionamento senza sostituzione = ogni prelievo è dipendente

Amir, Brian e Damian nella prima colonna indicano Claire nella seconda colonna con una probabilità del 33%

Introduzione alle statistiche in R

Esercitiamoci!

Introduzione alle statistiche in R

Preparing Video For Download...