Il teorema del limite centrale

Introduzione alla statistica in R

Maggie Matsui

Content Developer, DataCamp

Lanciare il dado 5 volte

die <- c(1, 2, 3, 4, 5, 6)

# Lancia 5 volte sample_of_5 <- sample(die, 5, replace = TRUE) sample_of_5
1 3 4 1 1
mean(sample_of_5)
2.0

 

dado a sei facce

Introduzione alla statistica in R

Lanciare il dado 5 volte

# Lancia 5 volte e calcola la media
sample(die, 5, replace = TRUE) %>% mean()
4.4
sample(die, 5, replace = TRUE) %>% mean()
3.8
Introduzione alla statistica in R

Lanciare il dado 5 volte per 10 volte

Ripeti 10 volte:

  • Lancia 5 volte
  • Calcola la media

 

sample_means <- replicate(10, sample(die, 5, replace = TRUE) %>% mean())

sample_means
3.8 4.0 3.8 3.6 3.2 4.8 2.6 3.0 2.6 2.0
Introduzione alla statistica in R

Distribuzioni campionarie

Distribuzione campionaria della media campionaria

istogramma di 10 medie campionarie

Introduzione alla statistica in R

100 medie campionarie

replicate(100, sample(die, 5, replace = TRUE) %>% mean())
2.8 3.2 1.8 4.6 4.0 2.8 4.4 2.4 3.4 2.8 4.2 3.4 ... 2.2 3.8 3.6 3.8 4.4 4.8 2.4

istogramma di 100 medie campionarie

Introduzione alla statistica in R

1000 medie campionarie

sample_means <- replicate(1000, sample(die, 5, replace = TRUE) %>% mean())

istogramma di 1000 medie campionarie

Introduzione alla statistica in R

Teorema del limite centrale

La distribuzione campionaria di una statistica si avvicina a quella normale al crescere del numero di prove.

istogrammi di 10, 100 e 1000 medie campionarie; con più campioni la distribuzione diventa più a campana

 

* I campioni devono essere casuali e indipendenti

Introduzione alla statistica in R

Deviazione standard e TLC

replicate(1000, sample(die, 5, replace = TRUE) %>% sd())

Distribuzione di 1000 deviazioni standard campionarie di 5 lanci di dado

Introduzione alla statistica in R

Proporzioni e TLC

sales_team <- c("Amir", "Brian", "Claire", "Damian")

sample(sales_team, 10, replace = TRUE)
"Claire" "Brian"  "Brian"  "Brian"  "Damian" "Damian" "Brian"  "Brian" 
"Amir"   "Amir"
sample(sales_team, 10, replace = TRUE)
"Amir"   "Amir"   "Claire" "Amir"   "Amir"   "Brian"  "Amir"   "Claire" 
"Claire" "Claire"
Introduzione alla statistica in R

Distribuzione campionaria della proporzione

La distribuzione delle proporzioni campionarie è anch'essa normale

Introduzione alla statistica in R

Media della distribuzione campionaria

# Stima del valore atteso del dado
mean(sample_means)
3.48
# Stima della proporzione di "Claire"
mean(sample_props)
0.26
  • Stimare caratteristiche della distribuzione sottostante sconosciuta

Distribuzione campionaria delle medie con linea tratteggiata al centro  

  • Stimare più facilmente caratteristiche di grandi popolazioni
Introduzione alla statistica in R

Passons à la pratique !

Introduzione alla statistica in R

Preparing Video For Download...