Advertencias sobre la correlación

Introducción a la estadística en R

Maggie Matsui

Content Developer, DataCamp

Relaciones no lineales

Diagrama de dispersión de variables con una relación cuadrática

$$r = 0.18$$

Introducción a la estadística en R

Relaciones no lineales

Lo que vemos:

diagrama de dispersión de variables con una relación cuadrática con línea de tendencia cuadrática

Lo que ve el coeficiente de correlación:

diagrama de dispersión de variables con una relación cuadrática con una línea de tendencia lineal

Introducción a la estadística en R

La correlación solo tiene en cuenta las relaciones lineales

La correlación no debe utilizarse a ciegas

cor(df$x, df$y)
0.1786163

Visualiza siempre tus datos

diagrama de dispersión de variables con una relación cuadrática

Introducción a la estadística en R

Datos sobre el sueño de los mamíferos

msleep
   name                       vore  sleep_total awake  bodywt
 1 Cheetah                    carni        12.1  11.9  50    
 2 Owl monkey                 omni         17     7     0.48 
 3 Mountain beaver            herbi        14.4   9.6   1.35 
 4 Greater short-tailed shrew omni         14.9   9.1   0.019
 5 Cow                        herbi         4    20   600    
 6 Three-toed sloth           herbi        14.4   9.6   3.85 
 ... 
Introducción a la estadística en R

Peso corporal frente a tiempo de vigilia

Gráfico de dispersión del peso corporal frente al tiempo de vigilia

cor(msleep$bodywt, msleep$awake)
0.3119801
Introducción a la estadística en R

Distribución del peso corporal

Histograma de la variable «bodywt»

Introducción a la estadística en R

Transformación logarítmica

msleep %>%
  mutate(log_bodywt = log(bodywt)) %>%

ggplot(aes(log_bodywt, awake)) + geom_point() + geom_smooth(method = "lm", se = FALSE)

 

cor(msleep$log_bodywt, msleep$awake)
0.5687943

Diagrama de dispersión del log del peso corporal frente al tiempo de vigilia

Introducción a la estadística en R

Otras transformaciones

  • Transformación logarítmica (log(x))
  • Transformación de raíz cuadrada (sqrt(x))
  • Transformación recíproca (1 / x)

  • Combinaciones de estas, por ejemplo:

    • log(x) y log(y)
    • sqrt(x) y 1 / y
Introducción a la estadística en R

¿Por qué utilizar una transformación?

  • Algunos métodos estadísticos se basan en que las variables tienen una relación lineal
    • Coeficiente de correlación
    • Regresión lineal
Introducción a la estadística en R

La correlación no implica causalidad

x está correlacionado con y no significa x que cause y

Diagrama de dispersión del consumo de margarina per cápita en EE. UU frente a la tasa de divorcios en Maine. Las variables están muy correlacionadas, con un coeficiente de correlación de 0,99

Introducción a la estadística en R

Confusión

  El consumo de café (x) apunta al cáncer de pulmón (y)

Introducción a la estadística en R

Confusión

  El consumo de café (x) apunta al cáncer de pulmón (y) con el tabaquismo (factor de confusión) arriba

Introducción a la estadística en R

Confusión

  El consumo de café (x) apunta al cáncer de pulmón (y) con el tabaquismo (factor de confusión). Doble flecha entre fumar y beber café, etiquetada como "asociación".

Introducción a la estadística en R

Confusión

  El consumo de café (x) apunta al cáncer de pulmón (y) con el tabaquismo (factor de confusión). Doble flecha entre fumar y beber café, etiquetada como "asociación". Flecha del tabaquismo al cáncer de pulmón etiquetada como "causalidad"

Introducción a la estadística en R

Confusión

  Consumo de café (x) con doble flecha hacia el cáncer de pulmón (y) etiquetado como "asociación". Doble flecha entre fumar y beber café, etiquetada como "asociación". Flecha del tabaquismo al cáncer de pulmón etiquetada de "causalidad".

  Las vacaciones (x) apuntan a las ventas al por menor (y). Las ofertas especiales (factor de confusión) tienen doble flecha hacia las vacaciones y una flecha hacia las ventas al por menor.

Introducción a la estadística en R

¡Practiquemos!

Introducción a la estadística en R

Preparing Video For Download...