Historia de dos variables

Introducción a la regresión en R

Richie Cotton

Data Evangelist at DataCamp

Datos de seguros de motor suecos

  • Cada fila representa una región de Suecia.
  • Hay 63 filas.
n_claims total_payment_sek
108 392.5
19 46.2
13 15.7
124 422.2
40 119.4
... ...
Introducción a la regresión en R

Estadísticos descriptivos

library(dplyr)
swedish_motor_insurance %>% 
  summarize_all(mean)
# A tibble: 1 x 2
  n_claims total_payment_sek
     <dbl>             <dbl>
1     22.9              98.2
swedish_motor_insurance %>% 
  summarize(
    correlation = cor(n_claims, total_payment_sek)
  )
# A tibble: 1 x 1
  correlation
        <dbl>
1       0.881
Introducción a la regresión en R

¿Qué es la regresión?

  • Modelos estadísticos para explorar la relación entre una respuesta y variables explicativas.
  • Con valores de las explicativas, puedes predecir la respuesta.
n_claims total_payment_sek
108 392.5
19 46.2
13 15.7
124 422.2
40 119.4
200 ???
Introducción a la regresión en R

Jerga

Variable de respuesta (o dependiente)

La variable que quieres predecir.

Variables explicativas (o independientes)

Las variables que explican cómo cambia la respuesta.

Introducción a la regresión en R

Regresión lineal y logística

Regresión lineal

  • La variable de respuesta es numérica.

Regresión logística

  • La variable de respuesta es lógica.

Regresión lineal/logística simple

  • Solo hay una variable explicativa.
Introducción a la regresión en R

Visualizar pares de variables

library(ggplot2)

ggplot(
  swedish_motor_insurance, 
  aes(n_claims, total_payment_sek)
) +
  geom_point()

Diagrama de dispersión del pago total frente al número de siniestros. El pago aumenta al aumentar los siniestros.

Introducción a la regresión en R

Añadir una tendencia lineal

library(ggplot2)

ggplot(
  swedish_motor_insurance, 
  aes(n_claims, total_payment_sek)
) +
  geom_point() +
  geom_smooth(
    method = "lm", 
    se = FALSE
  )

El mismo diagrama de dispersión, ahora con una línea de tendencia calculada con regresión lineal. Ajusta razonablemente bien.

Introducción a la regresión en R

Flujo del curso

Capítulo 1

Visualizar y ajustar modelos de regresión lineal.

Capítulo 2

Predecir con modelos lineales y entender sus coeficientes.

Capítulo 3

Evaluar la calidad del modelo lineal.

Capítulo 4

Lo mismo, pero con modelos de regresión logística.

Introducción a la regresión en R

¡Vamos a practicar!

Introducción a la regresión en R

Preparing Video For Download...