Criação de experimentos

Introdução à estatística em Python

Maggie Matsui

Content Developer, DataCamp

Vocabulário

O experimento visa responder: Qual é o efeito do tratamento sobre a resposta?

  • Tratamento: variável explicativa/independente
  • Resposta: variável de resposta/dependente

 

Ex.: Qual é o efeito de um anúncio sobre o número de produtos comprados?

  • Tratamento: anúncio
  • Resposta: número de produtos comprados
Introdução à estatística em Python

Experimentos controlados

  • Os participantes são distribuídos aos grupos de tratamento ou de controle
    • O grupo de tratamento vê o anúncio
    • O grupo de controle não
  • Os grupos devem ser comparáveis para que a causalidade possa ser inferida
  • Se os grupos não forem comparáveis, isso pode levar à confusão (viés)
    • Idade média do grupo de tratamento: 25
    • Idade média do grupo de controle: 50
    • Idade é um possível fator de confusão
Introdução à estatística em Python

O padrão ouro dos experimentos usará...

  • Estudo controlado aleatório

    • Os participantes são distribuídos aleatoriamente, sem base em outras características
    • A escolha aleatória ajuda a garantir que os grupos sejam comparáveis
  • Placebo

    • Assemelha-se ao tratamento, mas não tem efeito
    • Os participantes não saberão em qual grupo estão
    • Em estudos clínicos, uma pílula de açúcar garante que o efeito do medicamento seja realmente devido ao próprio medicamento e não à ideia de recebê-lo
Introdução à estatística em Python

O padrão ouro dos experimentos usará...

  • Estudo duplo-cego
    • A pessoa que administra o tratamento/executa o estudo não sabe se o tratamento é real ou um placebo
    • Evita a parcialidade na resposta e/ou na análise dos resultados

 

Menos oportunidades de viés = conclusão mais confiável sobre a causa

Introdução à estatística em Python

Estudos observacionais

  • Participantes não são designados aleatoriamente a grupos

    • Os participantes se autoatribuem, geralmente com base em características pré-existentes
  • Muitas perguntas de pesquisa não são propícias a um experimento controlado

    • Não se pode forçar alguém a fumar ou a ter uma doença
    • Não se pode obrigar alguém a ter determinado comportamento passado
  • Estabeleça a associação, não a causa
    • Efeitos podem ser confundidos por fatores que levaram certas pessoas ao grupo de controle ou tratamento
    • Há formas de controlar os fatores de confusão para obter melhores conclusões sobre a associação
Introdução à estatística em Python

Estudos longitudinais vs. transversais

Estudo longitudinal

  • Participantes acompanhados por um período para examinar o efeito do tratamento na resposta
  • O efeito da idade na altura não é confundido pela geração
  • Mais caro, resultados mais demorados

Estudo transversal

  • Dados dos participantes coletados de um único instante
  • O efeito da idade na altura é confundido pela geração
  • Mais barato, rápido e conveniente
Introdução à estatística em Python

Vamos praticar!

Introdução à estatística em Python

Preparing Video For Download...