O que é estatística?

Introdução à Estatística em R

Maggie Matsui

Content Developer, DataCamp

O que é estatística?

  • A área de estatística - prática e estudo de coletar e analisar dados

  • Estatística-resumo - um fato ou resumo sobre dados

Introdução à Estatística em R

O que é estatística?

  • A área de estatística - prática e estudo de coletar e analisar dados

  • Estatística-resumo - um fato ou resumo sobre dados

O que a estatística pode fazer?

  • Qual a chance de alguém comprar um produto? As pessoas compram mais se puderem usar outro meio de pagamento?
  • Quantas pessoas vão ocupar seu hotel? Como otimizar a ocupação?
  • Quantos tamanhos de jeans fabricar para vestir 95% da população? Produzir a mesma quantidade de cada tamanho?
  • Testes A/B: qual anúncio gera mais compras?
Introdução à Estatística em R

O que a estatística não faz?

  • Por que Game of Thrones é tão popular?

Em vez disso...

  • Séries com mais cenas violentas têm mais audiência?

Mas...

  • Ainda assim, isso não diz se mais violência causa mais views
Introdução à Estatística em R

Tipos de estatística

Estatística descritiva

  • Descreve e resume dados

2 carros, 1 ônibus, 1 bicicleta

  • 50% dos amigos vão de carro
  • 25% vão de ônibus
  • 25% vão de bicicleta

Estatística inferencial

  • Usa uma amostra para fazer inferências sobre a população

2 carros, 1 ônibus, 1 bicicleta cercados por mais carros, ônibus e bicicletas

Qual porcentagem vai ao trabalho de carro?

Introdução à Estatística em R

Tipos de dados

Numérico (Quantitativo)

  • Contínuo (Medido)
    • Velocidade do avião
    • Tempo esperando na fila
  • Discreto (Contado)
    • Número de pets
    • Número de pacotes enviados

Categórico (Qualitativo)

  • Nominal (Sem ordem)
    • Casado/solteiro
    • País de residência
  • Ordinal (Com ordem)

discordo totalmente/discordo parcialmente/nem concordo nem discordo/concordo parcialmente/concordo totalmente

Introdução à Estatística em R

Dados categóricos podem virar números

Nominal (Sem ordem)

  • Casado/solteiro (1/0)
  • País de residência (1, 2, ...)

Ordinal (Com ordem)

  • Discordo totalmente (1)
  • Discordo parcialmente (2)
  • Nem concordo nem discordo (3)
  • Concordo parcialmente (4)
  • Concordo totalmente (5)
Introdução à Estatística em R

Por que o tipo de dado importa?

Estatísticas-resumo
car_speeds %>% 
  summarize(avg_speed = mean(speed_mph))
  avg_speed
1  40.09062
Gráficos

dispersão de velocidade do carro vs peso do carro

Introdução à Estatística em R

Por que o tipo de dado importa?

Estatísticas-resumo
demographics %>% 
  count(marriage_status)
  marriage_status     n
1          single   188
2         married   143
3        divorced   124
Gráficos

gráfico de barras da contagem por estado civil

Introdução à Estatística em R

Vamos praticar!

Introdução à Estatística em R

Preparing Video For Download...