Planejamento de experimentos

Introdução à Estatística em R

Maggie Matsui

Content Developer, DataCamp

Vocabulário

O experimento busca responder: Qual é o efeito do tratamento na resposta?

  • Tratamento: variável explicativa/independente
  • Resposta: variável de resposta/dependente

 

Qual é o efeito de um anúncio no número de produtos comprados?

  • Tratamento: anúncio
  • Resposta: número de produtos comprados
Introdução à Estatística em R

Experimentos controlados

  • Pesquisadores atribuem participantes ao grupo de tratamento ou controle
    • Tratamento: vê o anúncio
    • Controle: não vê
  • Grupos devem ser comparáveis para inferir causalidade
  • Se não forem, pode haver confundimento (viés)
    • Idade média do tratamento: 25
    • Idade média do controle: 50
    • Idade é um possível confundidor
Introdução à Estatística em R

O padrão-ouro usa...

  • Ensaio clínico randomizado

    • Participantes são atribuídos a tratamento/controle aleatoriamente, não por outras características
    • A aleatorização ajuda a tornar os grupos comparáveis
  • Placebo

    • Se parece com o tratamento, mas não tem efeito
    • Participantes não sabem em que grupo estão
    • Em estudos clínicos, um comprimido de açúcar garante que o efeito do remédio venha do remédio, não da ideia de recebê-lo
Introdução à Estatística em R

O padrão-ouro usa...

  • Duplo-cego
    • Quem aplica o tratamento/conduz o estudo não sabe se é real ou placebo
    • Evita viés na resposta e/ou na análise

 

Menos oportunidades de viés = conclusão mais confiável sobre causalidade

Introdução à Estatística em R

Estudos observacionais

  • Participantes não são atribuídos aleatoriamente

    • Eles se autoatribuem, geralmente por características pré-existentes
  • Muitas perguntas não cabem em experimento controlado

    • Não dá para forçar alguém a fumar ou ter uma doença
    • Nem impor certo comportamento passado
  • Estabelece associação, não causalidade
    • Efeitos podem ser confundidos por fatores que levaram certas pessoas ao controle ou tratamento
    • Há formas de controlar confundidores para conclusões mais confiáveis sobre associação
Introdução à Estatística em R

Estudos longitudinais vs. transversais

Estudo longitudinal

  • Participantes são acompanhados por um período para avaliar o efeito do tratamento na resposta
  • Efeito da idade na altura não é confundido por geração
  • Mais caro, resultados demoram mais

Estudo transversal

  • Dados coletados em um único momento
  • Efeito da idade na altura é confundido por geração
  • Mais barato, rápido e prático
Introdução à Estatística em R

Vamos praticar!

Introdução à Estatística em R

Preparing Video For Download...