O teorema central do limite

Introdução à Estatística em R

Maggie Matsui

Content Developer, DataCamp

Lançando o dado 5 vezes

die <- c(1, 2, 3, 4, 5, 6)

# Roll 5 times sample_of_5 <- sample(die, 5, replace = TRUE) sample_of_5
1 3 4 1 1
mean(sample_of_5)
2.0

 

dado de seis faces

Introdução à Estatística em R

Lançando o dado 5 vezes

# Roll 5 times and take mean
sample(die, 5, replace = TRUE) %>% mean()
4.4
sample(die, 5, replace = TRUE) %>% mean()
3.8
Introdução à Estatística em R

Lançando o dado 5 vezes, 10 vezes

Repetir 10 vezes:

  • Lance 5 vezes
  • Tire a média

 

sample_means <- replicate(10, sample(die, 5, replace = TRUE) %>% mean())

sample_means
3.8 4.0 3.8 3.6 3.2 4.8 2.6 3.0 2.6 2.0
Introdução à Estatística em R

Distribuições amostrais

Distribuição amostral da média amostral

histograma de 10 médias amostrais

Introdução à Estatística em R

100 médias amostrais

replicate(100, sample(die, 5, replace = TRUE) %>% mean())
2.8 3.2 1.8 4.6 4.0 2.8 4.4 2.4 3.4 2.8 4.2 3.4 ... 2.2 3.8 3.6 3.8 4.4 4.8 2.4

histograma de 100 médias amostrais

Introdução à Estatística em R

1000 médias amostrais

sample_means <- replicate(1000, sample(die, 5, replace = TRUE) %>% mean())

histograma de 1000 médias amostrais

Introdução à Estatística em R

Teorema central do limite

A distribuição amostral de uma estatística se aproxima da normal conforme aumentam os ensaios.

histogramas de 10, 100 e 1000 médias amostrais; com mais amostras, a distribuição fica mais em forma de sino

 

* Amostras devem ser aleatórias e independentes

Introdução à Estatística em R

Desvio-padrão e o TCL

replicate(1000, sample(die, 5, replace = TRUE) %>% sd())

Distribuição de 1000 desvios-padrão amostrais de 5 lançamentos de dado

Introdução à Estatística em R

Proporções e o TCL

sales_team <- c("Amir", "Brian", "Claire", "Damian")

sample(sales_team, 10, replace = TRUE)
"Claire" "Brian"  "Brian"  "Brian"  "Damian" "Damian" "Brian"  "Brian" 
"Amir"   "Amir"
sample(sales_team, 10, replace = TRUE)
"Amir"   "Amir"   "Claire" "Amir"   "Amir"   "Brian"  "Amir"   "Claire" 
"Claire" "Claire"
Introdução à Estatística em R

Distribuição amostral da proporção

A distribuição de proporções amostrais também parece normal

Introdução à Estatística em R

Média da distribuição amostral

# Estimate expected value of die
mean(sample_means)
3.48
# Estimate proportion of "Claire"s
mean(sample_props)
0.26
  • Estimar características da distribuição subjacente desconhecida

Distribuição amostral das médias com linha tracejada ao centro  

  • Estimar mais facilmente características de grandes populações
Introdução à Estatística em R

Vamos praticar!

Introdução à Estatística em R

Preparing Video For Download...