Distribuições discretas

Introdução à estatística em Python

Maggie Matsui

Content Developer, DataCamp

Jogando os dados

Dado de seis lados

Jogando os dados

Cada lado de um dado tem 1/6 de probabilidade

Escolha de vendedores

Nomes em uma caixa, cada um com 25% de probabilidade

Distribuição de probabilidade

Descreve a probabilidade de cada resultado possível em um cenário

Cada lado de um dado tem 1/6 de probabilidade

Valor esperado: média de uma distribuição de probabilidade

Valor esperado de um lançamento de dado justo = $(1 \times \frac{1}{6}) + (2 \times \frac{1}{6}) +(3 \times \frac{1}{6}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3.5$

Visualização de distribuição de probabilidade

Gráfico de barras com uma barra para cada número de 1 a 6, com altura de 1/6

Probabilidade = área

$$P(\text{die roll}) \le 2 = ~?$$

Barras para 1 e 2 destacadas

Probabilidade = área

$$P(\text{die roll}) \le 2 = 1/3$$

1/6 + 1/6 = 1/3

Dado viciado

dado de seis lados com dois lados com 3 pontos

Valor esperado do lançamento do dado viciado= $(1 \times \frac{1}{6}) +(2 \times 0) +(3 \times \frac{1}{3}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3.67$

Visualização de probabilidades desiguais

Distribuição de probabilidade do dado viciado. As barras para 1, 4, 5 e 6 têm altura 1/6, a barra para 2 tem altura 0, a barra para 3 tem altura 1/3

Adicionar áreas

$$P(\text{uneven die roll}) \le 2 = ~?$$

1/6 + 0

Adicionar áreas

$$P(\text{uneven die roll}) \le 2 = 1/6$$

1/6 + 0

Distribuições de probabilidade discretas

Descreva as probabilidades de resultados discretos

Dado justo

Gráfico de dado justo

Distribuição uniforme discreta

Dado viciado

Gráfico do dado viciado

Amostragem de distribuições discretas

print(die)

  number      prob
0      1  0.166667
1      2  0.166667
2      3  0.166667
3      4  0.166667
4      5  0.166667
5      6  0.166667

np.mean(die['number'])

3.5

rolls_10 = die.sample(10, replace = True)
rolls_10

  number      prob
0      1  0.166667
0      1  0.166667
4      5  0.166667
1      2  0.166667
0      1  0.166667
0      1  0.166667
5      6  0.166667
5      6  0.166667
...

Visualização de amostra

rolls_10['number'].hist(bins=np.linspace(1,7,7)) 
plt.show()

histograma de 10 jogadas

Distribuição de amostra vs. distribuição teórica

Amostra de 10 jogadas

histograma de 10 jogadas

np.mean(rolls_10['number']) = 3.0

Distribuição teórica de probabilidade

distribuição de probabilidade de um dado justo

mean(die['number']) = 3.5

Uma amostra maior

Amostra de 100 jogadas

histograma de 100 jogadas

np.mean(rolls_100['number']) = 3.4

Distribuição teórica de probabilidade

distribuição de probabilidade de um dado justo

mean(die['number']) = 3.5

Uma amostra ainda maior

Amostra de 1.000 jogadas

histograma de 1000 jogadas

np.mean(rolls_1000['number']) = 3.48

Distribuição teórica de probabilidade

distribuição de probabilidade de um dado justo

mean(die['number']) = 3.5

Lei dos grandes números

À medida que o tamanho da sua amostra aumenta, a média da amostra se aproximará do valor esperado.

Tamanho da amostra	Média
10	3,00
100	3,40
1000	3,48

Vamos praticar!

Introdução à estatística em Python