Diseño de experimentos

Introducción a la estadística en Python

Maggie Matsui

Content Developer, DataCamp

Vocabulario

El experimento pretende responder: ¿cuál es el efecto del tratamiento sobre la respuesta?

  • Tratamiento: variable independiente/explicativa
  • Respuesta: variable dependiente/respuesta

 

Por ejemplo: ¿cuál es el efecto de un anuncio en el número de productos comprados?

  • Tratamiento: publicidad
  • Respuesta: número de productos comprados
Introducción a la estadística en Python

Experimentos controlados

  • Los investigadores asignan a los participantes al grupo de tratamiento o al grupo de control.
    • El grupo de tratamiento ve el anuncio.
    • El grupo de control no.
  • Los grupos deben ser comparables para que pueda inferirse la causalidad.
  • Si los grupos no son comparables, puede haber confusión (sesgo).
    • Edad media del grupo de tratamiento: 25
    • Edad media del grupo de control: 50
    • La edad es un factor de confusión potencial.
Introducción a la estadística en Python

El estándar de oro de los experimentos utilizará...

  • Ensayo controlado aleatorio

    • Los participantes se asignan al tratamiento/control aleatoriamente, no en función de otras características.
    • Elegir al azar ayuda a garantizar que los grupos sean comparables.
  • Placebo

    • Se asemeja al tratamiento, pero no tiene efecto.
    • Los participantes no sabrán en qué grupo están.
    • En los ensayos clínicos, una pastilla de azúcar garantiza que el efecto del fármaco se debe realmente al fármaco en sí y no a la idea de recibir el fármaco.
Introducción a la estadística en Python

El estándar de oro de los experimentos utilizará...

  • Ensayo doble ciego
    • La persona que administra el tratamiento/dirige el estudio no sabe si el tratamiento es real o un placebo.
    • Evita sesgos en la respuesta o en el análisis de los resultados.

 

Menos oportunidades de sesgo = conclusión más fiable sobre la causalidad

Introducción a la estadística en Python

Estudios observacionales

  • Los participantes no se asignan aleatoriamente a los grupos.

    • Los participantes se asignan a sí mismos, normalmente según las características preexistentes.
  • Muchas preguntas de investigación no se prestan a un experimento controlado.

    • No puedes obligar a alguien a fumar o a tener una enfermedad.
    • No puedes obligar a alguien a tener cierto comportamiento pasado.
  • Se establece la asociación, no la causalidad
    • Los efectos pueden estar confundidos por factores que hicieron que determinadas personas entraran en el grupo de control o de tratamiento.
    • Hay formas de controlar los factores de confusión para obtener conclusiones más fiables sobre la asociación.
Introducción a la estadística en Python

Estudios longitudinales frente a estudios transversales

Estudio longitudinal

  • Se sigue a los participantes durante un periodo de tiempo para estudiar el efecto del tratamiento en la respuesta
  • El efecto de la edad en la estatura no se ve afectado por la generación
  • Cuesta más, los resultados tardan más

Estudio transversal

  • Los datos de los participantes se recogen a partir de una única instantánea en el tiempo
  • El efecto de la edad en la estatura se confunde con la generación
  • Cuesta menos, más rápido, más cómodo
Introducción a la estadística en Python

¡Vamos a practicar!

Introducción a la estadística en Python

Preparing Video For Download...