O que é estatística?

Introdução à estatística em Python

Maggie Matsui

Content Developer, DataCamp

O que é estatística?

  • Campo da estatística: a prática e o estudo da coleta e análise de dados

  • Estatística resumo: um fato ou resumo de alguns dados

Introdução à estatística em Python

O que a estatística pode fazer?

O que é estatística?

  • Campo da estatística: a prática e o estudo da coleta e análise de dados

  • Estatística resumo: um fato ou resumo de alguns dados

O que a estatística pode fazer?

  • Qual é a probabilidade de alguém comprar um produto? É mais provável que comprem o produto se puderem usar um meio de pagamento diferente?
  • Quantos ocupantes seu hotel terá? Como otimizar a ocupação?
  • Quantos tamanhos de jeans precisam ser fabricados para que sirvam em 95% da população? Deve ser produzido o mesmo número de cada tamanho?
  • Testes A/B: Qual anúncio é mais eficaz para que as pessoas comprem um produto?
Introdução à estatística em Python

O que as estatísticas não fazem?

  • Por que Game of Thrones é tão popular?

Em vez disso...

  • Séries com mais violência são vistas por mais pessoas?

Mas...

  • Mesmo assim, isso não diz se mais violência leva a mais visualizações
Introdução à estatística em Python

Tipos de estatísticas

Estatísticas descritivas

  • Descreve e resume dados

2 carros, 1 ônibus, 1 bicicleta

  • 50% dos amigos dirigem ao trabalho
  • 25% pegam ônibus
  • 25% vão de bicicleta

Estatísticas inferenciais

  • Usa uma amostra de dados para fazer inferências sobre um grupo maior

2 carros, 1 ônibus, 1 bicicleta cercados por mais carros, ônibus e bicicletas

Porcentagem de pessoas que dirigem ao trabalho

Introdução à estatística em Python

Tipos de dados

Numérico (quantitativo)

  • Contínuo (medido)
    • Velocidade do avião
    • Tempo de espera na fila
  • Discreto (contado)
    • Número de pets
    • Número de pacotes enviados

Categórico (qualitativo)

  • Nominal (não ordenado)
    • Casado/não casado
    • País de residência
  • Ordinal (ordenado)

discordo totalmente/discordo um pouco/nem concordo nem discordo/concordo um pouco/concordo totalmente

Introdução à estatística em Python

Dados categóricos podem ser representados por números

Nominal (não ordenado)

  • Casado/não casado (1/0)
  • País de residência (1, 2, ...)

Ordinal (ordenado)

  • Discordo totalmente (1)
  • Discordo um pouco (2)
  • Nem concordo nem discordo (3)
  • Concordo um pouco (4)
  • Concordo totalmente(5)
Introdução à estatística em Python

Por que o tipo de dados é importante?

Estatísticas resumo
import numpy as np
np.mean(car_speeds['speed_mph'])
40.09062
Gráficos

gráfico de dispersão da velocidade do carro em relação ao peso do carro

Introdução à estatística em Python

Por que o tipo de dados é importante?

Estatísticas resumo
demographics['marriage_status'].value_counts()
single      188
married     143
divorced    124
dtype: int64
Gráficos

Gráfico de barras da contagem de status de casamento

Introdução à estatística em Python

Vamos praticar!

Introdução à estatística em Python

Preparing Video For Download...