Regresión a la media

Introducción a la regresión en R

Richie Cotton

Data Evangelist

El concepto

  • Valor de respuesta = valor ajustado + residual
  • "Lo que explicaste" + "lo que no pudiste explicar"
  • Los residuales existen por problemas del modelo y por aleatoriedad
  • Los casos extremos suelen deberse a la aleatoriedad
  • La regresión a la media implica que los casos extremos no persisten
Introducción a la regresión en R

Conjunto padre-hijo de Pearson

  • 1078 pares padre/hijo
  • ¿Los padres altos tienen hijos altos?
father_height_cm son_height_cm
165.2 151.8
160.7 160.6
165.0 160.9
167.0 159.5
155.3 163.3
... ...
1 Adaptado de https://www.rdocumentation.org/packages/UsingR/topics/father.son
Introducción a la regresión en R

Diagrama de dispersión

plt_son_vs_father <- ggplot(
  father_son, 
  aes(father_height_cm, son_height_cm)
) +
  geom_point() +
  geom_abline(color = "green", size = 1) +
  coord_fixed()

Diagrama de dispersión de alturas de hijos frente a padres, con una línea donde tendrían la misma altura. A mayor altura del padre, mayor la del hijo.

Introducción a la regresión en R

Añadir una recta de regresión

plt_son_vs_father +
  geom_smooth(method = "lm", se = FALSE)

Diagrama de dispersión de alturas de hijos frente a padres, con una tendencia lineal. La línea de tendencia es menos inclinada que la línea de igual altura padre-hijo.

Introducción a la regresión en R

Ejecutar una regresión

mdl_son_vs_father <- lm(
  son_height_cm ~ father_height_cm, 
  data = father_son
)
Call:
lm(formula = son_height_cm ~ father_height_cm, data = father_son)

Coefficients:
     (Intercept)  father_height_cm  
          86.072             0.514
Introducción a la regresión en R

Hacer predicciones

really_tall_father <- tibble(
  father_height_cm = 190
)
predict(mdl_son_vs_father, really_tall_father)
183.7
really_short_father <- tibble(
  father_height_cm = 150
)
predict(mdl_son_vs_father, really_short_father)
163.2
Introducción a la regresión en R

¡Vamos a practicar!

Introducción a la regresión en R

Preparing Video For Download...