Correlación

Introducción a la estadística

George Boorman

Curriculum Manager, DataCamp

Relaciones entre dos variables

scatter_plot_displaying_monthly_gym_costs_vs_cost_of_a_bottle_of_water.png

Introducción a la estadística

Coeficiente de correlación de Pearson

  • Lo publicó Karl Pearson en 1896.
  • Cuantifica la fuerza de una relación entre dos variables.
  • Número entre menos uno y uno.
  • La magnitud corresponde a la fuerza de la relación.
  • El signo (+ o -) corresponde a la dirección de la relación.
1 https://royalsocietypublishing.org/doi/10.1098/rsta.1896.0007
Introducción a la estadística

Relaciones lineales

  • Lineal = cambios proporcionales entre las variables dependientes e independientes.

scatter_plot_of_gym_vs_water_costs_with_annotations_for_observations_of_one_dollar_water_and_thirty_dollar_gym_costs_plus_one_dollar_fifty_water_and_forty_five_dollar_gym_costs_and_correlation_coefficient_equals_zero_point_three_six.png

Introducción a la estadística

Valores = fuerza de la relación

0,99 (relación muy fuerte)

Scatterplot with points very close to an invisible line.png

Introducción a la estadística

Valores = fuerza de la relación

0,99 (relación muy fuerte)

Scatterplot with points very close to an invisible line.png

0,75 (relación fuerte)

Scatterplot with points further from the invisible line.png

Introducción a la estadística

Valores = fuerza de la relación

0,56 (relación moderada)

Scatterplot with points even further from the invisible line.png

Introducción a la estadística

Valores = fuerza de la relación

0,56 (relación moderada)

Scatterplot with points even further from the invisible line.png

0,21 (relación débil)

Scatterplot with points that look almost totally randomly scattered.png

Introducción a la estadística

Valores = fuerza de la relación

0,04 (sin relación)

Scatterplot with points that look totally randomly scattered.png

  • Conocer el valor de x no nos dice nada sobre y.
Introducción a la estadística

Signo = dirección

0,75: a medida que x aumenta, y aumenta

Scatterplot where y increases as x increases.png

-0,75: a medida que x aumenta, y disminuye

Scatterplot where y decreases as x increases.png

Introducción a la estadística

Costes del gimnasio frente a costes del agua

scatter_plot_displaying_monthly_gym_costs_vs_cost_of_a_bottle_of_water.png

Introducción a la estadística

Añadir una línea de tendencia

scatter_plot_displaying_monthly_gym_costs_vs_cost_of_a_bottle_of_water_with_trendline_and_annotated_p_equals_zero_point_three_five.png

Introducción a la estadística

Esperanza de vida frente al coste de una botella de agua

scater_plot_of_life_expectancy_vs_water_bottle_cost_showing_trendline_and_p_equals_zero_point_six_one.png

Introducción a la estadística

La correlación no implica causalidad.

  • ¿El aumento del coste del agua provocará un aumento de la esperanza de vida?

water_bottles.png

elderly_couple.png

  • La correlación no implica causalidad.
1 Crédito de la imagen: https://unsplash.com/@micheile; https://unsplash.com/@jon_chng
Introducción a la estadística

Variables de confusión

  • ¿Qué otros factores podrían estar afectando la esperanza de vida?

    • Una botella de agua cuesta más en países con economías fuertes.
    • Estos países suelen ofrecer acceso a una asistencia sanitaria de alta calidad.
  • La fortaleza de la economía podría ser una variable de confusión.

    • Una variable de confusión no se mide, pero puede afectar a la relación entre nuestras variables.

doctor.jpg

Introducción a la estadística

¡Vamos a practicar!

Introducción a la estadística

Preparing Video For Download...