Distribuições discretas

Introdução à estatística em Python

Maggie Matsui

Content Developer, DataCamp

Jogando os dados

Dado de seis lados

Introdução à estatística em Python

Jogando os dados

Cada lado de um dado tem 1/6 de probabilidade

Introdução à estatística em Python

Escolha de vendedores

 

Nomes em uma caixa, cada um com 25% de probabilidade

Introdução à estatística em Python

Distribuição de probabilidade

Descreve a probabilidade de cada resultado possível em um cenário

Cada lado de um dado tem 1/6 de probabilidade

 

Valor esperado: média de uma distribuição de probabilidade

Valor esperado de um lançamento de dado justo = $(1 \times \frac{1}{6}) + (2 \times \frac{1}{6}) +(3 \times \frac{1}{6}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3.5$

Introdução à estatística em Python

Visualização de distribuição de probabilidade

Gráfico de barras com uma barra para cada número de 1 a 6, com altura de 1/6

Introdução à estatística em Python

Probabilidade = área

$$P(\text{die roll}) \le 2 = ~?$$

Barras para 1 e 2 destacadas

Introdução à estatística em Python

Probabilidade = área

$$P(\text{die roll}) \le 2 = 1/3$$

1/6 + 1/6 = 1/3

Introdução à estatística em Python

Dado viciado

dado de seis lados com dois lados com 3 pontos

Valor esperado do lançamento do dado viciado= $(1 \times \frac{1}{6}) +(2 \times 0) +(3 \times \frac{1}{3}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3.67$

Introdução à estatística em Python

Visualização de probabilidades desiguais

Distribuição de probabilidade do dado viciado. As barras para 1, 4, 5 e 6 têm altura 1/6, a barra para 2 tem altura 0, a barra para 3 tem altura 1/3

Introdução à estatística em Python

Adicionar áreas

$$P(\text{uneven die roll}) \le 2 = ~?$$

1/6 + 0

Introdução à estatística em Python

Adicionar áreas

$$P(\text{uneven die roll}) \le 2 = 1/6$$

1/6 + 0

Introdução à estatística em Python

Distribuições de probabilidade discretas

Descreva as probabilidades de resultados discretos

Dado justo

Gráfico de dado justo

                 Distribuição uniforme discreta

 

Dado viciado

Gráfico do dado viciado

Introdução à estatística em Python

Amostragem de distribuições discretas

print(die)
  number      prob
0      1  0.166667
1      2  0.166667
2      3  0.166667
3      4  0.166667
4      5  0.166667
5      6  0.166667
np.mean(die['number'])
3.5
rolls_10 = die.sample(10, replace = True)
rolls_10
  number      prob
0      1  0.166667
0      1  0.166667
4      5  0.166667
1      2  0.166667
0      1  0.166667
0      1  0.166667
5      6  0.166667
5      6  0.166667
...
Introdução à estatística em Python

Visualização de amostra

rolls_10['number'].hist(bins=np.linspace(1,7,7)) 
plt.show()

histograma de 10 jogadas

Introdução à estatística em Python

Distribuição de amostra vs. distribuição teórica

Amostra de 10 jogadas

histograma de 10 jogadas

np.mean(rolls_10['number']) = 3.0

Distribuição teórica de probabilidade

 

distribuição de probabilidade de um dado justo

mean(die['number']) = 3.5

Introdução à estatística em Python

Uma amostra maior

Amostra de 100 jogadas

histograma de 100 jogadas

np.mean(rolls_100['number']) = 3.4

Distribuição teórica de probabilidade

 

distribuição de probabilidade de um dado justo

mean(die['number']) = 3.5

Introdução à estatística em Python

Uma amostra ainda maior

Amostra de 1.000 jogadas

histograma de 1000 jogadas

np.mean(rolls_1000['number']) = 3.48

Distribuição teórica de probabilidade

 

distribuição de probabilidade de um dado justo

mean(die['number']) = 3.5

Introdução à estatística em Python

Lei dos grandes números

À medida que o tamanho da sua amostra aumenta, a média da amostra se aproximará do valor esperado.

Tamanho da amostra Média
10 3,00
100 3,40
1000 3,48
Introdução à estatística em Python

Vamos praticar!

Introdução à estatística em Python

Preparing Video For Download...