Mais distribuições de probabilidade

Introdução à estatística em Python

Maggie Matsui

Content Developer, DataCamp

Distribuição exponencial

  • Probabilidade de tempo entre eventos de Poisson

  • Exemplos

    • Probabilidade de > 1 dia entre as adoções
    • Probabilidade de < 10 minutos entre chegadas no restaurante
    • Probabilidade de 6 a 8 meses entre terremotos
  • Também usa lambda (taxa)

  • Contínuo (tempo)

Introdução à estatística em Python

Solicitações de atendimento

  • Em média, um incidente de atendimento é criado a cada 2 minutos
    • $\lambda$ = 0,5 incidente de atendimento criado a cada minuto

Distribuição exponencial com lambda = 0,5

Introdução à estatística em Python

Lambda na distribuição exponencial

3 Distribuições exponenciais com lambda = 0,5, lambda = 1 e lambda = 1,5

Introdução à estatística em Python

Valor esperado da distribuição exponencial

Em termos de taxa (Poisson):

  • $\lambda$ = $0.5 \text{ requests}$ por minuto

 

Em termos de tempo entre eventos (exponencial):

  • $1/\lambda$ = 1 solicitação por $2 \text{minutos}$
  • $1/0.5$ = $2$
Introdução à estatística em Python

Quanto tempo para uma nova solicitação ser criada?

 

from scipy.stats import expon
  • scale = $1/\lambda$ = $1/0.5$ = $2$

$P(\text{wait} < \text{1 min})$ =

expon.cdf(1, scale=2)
0.3934693402873666

$P(\text{wait} > \text{4 min})$ =

1- expon.cdf(4, scale=2)
0.1353352832366127

$P(\text{1 min} < \text{wait} < \text{4 min})$ =

expon.cdf(4, scale=2) - expon.cdf(1, scale=2)
0.4711953764760207
Introdução à estatística em Python

Distribuição t (de Student)

  • Forma semelhante à da distribuição normal

Distribuição t e distribuição normal plotadas nos mesmos eixos

Introdução à estatística em Python

Graus de liberdade

  • Tem um parâmetro de graus de liberdade (df) que afeta a espessura das caudas
    • Df mais baixo = caudas mais grossas, desvio padrão maior
    • Maior df = mais próximo da distribuição normal

3 distribuições t com df = 1, df = 5 e df = 10

Introdução à estatística em Python

Distribuição lognormal

  • Variável cujo logaritmo é distribuído normalmente

  • Exemplos:

    • Duração de jogos de xadrez
    • Pressão arterial adulta
    • Número de hospitalizações no surto de SARS de 2003

3 distribuições log-normais com sd = 0,5, sd = 1 e sd = 1,5

Introdução à estatística em Python

Vamos praticar!

Introdução à estatística em Python

Preparing Video For Download...