El teorema del límite central

Introducción a la estadística en R

Maggie Matsui

Content Developer, DataCamp

Tirar los dados 5 veces

die <- c(1, 2, 3, 4, 5, 6)

# Roll 5 times sample_of_5 <- sample(die, 5, replace = TRUE) sample_of_5
1 3 4 1 1
mean(sample_of_5)
2.0

 

dado de seis caras

Introducción a la estadística en R

Tirar los dados 5 veces

# Roll 5 times and take mean
sample(die, 5, replace = TRUE) %>% mean()
4.4
sample(die, 5, replace = TRUE) %>% mean()
3.8
Introducción a la estadística en R

Tirar los dados 5 veces 10 veces

Repite 10 veces:

  • Tira 5 veces
  • Obtén la media

 

sample_means <- replicate(10, sample(die, 5, replace = TRUE) %>% mean())

sample_means
3.8 4.0 3.8 3.6 3.2 4.8 2.6 3.0 2.6 2.0
Introducción a la estadística en R

Distribuciones muestrales

Distribución muestral de la media muestral

Histograma de 10 medias muestrales

Introducción a la estadística en R

100 medias muestrales

replicate(100, sample(die, 5, replace = TRUE) %>% mean())
2.8 3.2 1.8 4.6 4.0 2.8 4.4 2.4 3.4 2.8 4.2 3.4 ... 2.2 3.8 3.6 3.8 4.4 4.8 2.4

Histograma de 100 medias muestrales

Introducción a la estadística en R

1000 medias muestrales

sample_means <- replicate(1000, sample(die, 5, replace = TRUE) %>% mean())

Histograma de 1000 medias muestrales

Introducción a la estadística en R

Teorema del límite central

La distribución muestral de una estadística se aproxima más a la distribución normal a medida que aumenta el número de intentos.

histogramas de 10, 100 y 1000 medias muestrales, donde un mayor número de medias muestrales tiene una distribución en forma de curva de campana

 

  • Las muestras deben ser aleatorias e independientes.
Introducción a la estadística en R

La desviación típica y el TLC

replicate(1000, sample(die, 5, replace = TRUE) %>% sd())

Distribución de 1000 desviaciones estándar muestrales de 5 tiradas de dados

Introducción a la estadística en R

Las proporciones y el TLC

sales_team <- c("Amir", "Brian", "Claire", "Damian")

sample(sales_team, 10, replace = TRUE)
"Claire" "Brian"  "Brian"  "Brian"  "Damian" "Damian" "Brian"  "Brian" 
"Amir"   "Amir"
sample(sales_team, 10, replace = TRUE)
"Amir"   "Amir"   "Claire" "Amir"   "Amir"   "Brian"  "Amir"   "Claire" 
"Claire" "Claire"
Introducción a la estadística en R

Distribución muestral de la proporción

La distribución de las proporciones de la muestra también parece normal

Introducción a la estadística en R

Media de la distribución muestral

# Estimate expected value of die
mean(sample_means)
3.48
# Estimate proportion of "Claire"s
mean(sample_props)
0.26
  • Se estiman las características de una distribución subyacente desconocida

Distribución muestral de las medias muestrales con una línea discontinua en el centro.  

  • Se estiman más fácilmente las características de grandes poblaciones
Introducción a la estadística en R

¡Vamos a practicar!

Introducción a la estadística en R

Preparing Video For Download...