Quais são as chances?

Introdução à estatística em Python

Maggie Matsui

Content Developer, DataCamp

Medindo a chance

Qual é a probabilidade de um evento?

$$ P(\text{event}) = \frac{\text{\# ways event can happen}}{\text{total \# of possible outcomes}} $$

Exemplo: cara ou coroa

$$ P(\text{heads}) = \frac{\text{1 way to get heads}}{\text{2 possible outcomes}} = \frac{1}{2} = 50\%$$

Linha numérica de probabilidade. 0 por cento = impossível, 100 por cento = certamente acontecerá

Introdução à estatística em Python

Atribuição de vendedores

Caixa com os nomes de Amir, Brian, Claire e Damian

Introdução à estatística em Python

Atribuição de vendedores

Pegando o nome de Brian

$$P(\text{Brian}) = \frac{1}{4} = 25\%$$

Introdução à estatística em Python

Amostragem de um DataFrame

print(sales_counts)
     name  n_sales
0    Amir      178
1   Brian      128
2  Claire       75
3  Damian       69
sales_counts.sample()
    name  n_sales
1  Brian      128
sales_counts.sample()
     name  n_sales
2  Claire       75
Introdução à estatística em Python

Definir uma semente aleatória

np.random.seed(10)

sales_counts.sample()
    name  n_sales
1  Brian      128
np.random.seed(10)
sales_counts.sample()
    name  n_sales
1  Brian      128
np.random.seed(10)
sales_counts.sample()
    name  n_sales
1  Brian      128
Introdução à estatística em Python

Uma segunda reunião

Amostragem sem substituição

Caixa com Amir, Claire, Damian

Introdução à estatística em Python

Uma segunda reunião

O nome da Claire foi retirado

$$P(\text{Claire}) = \frac{1}{3} = 33\%$$

Introdução à estatística em Python

Amostragem dupla em Python

sales_counts.sample(2)
     name  n_sales
1   Brian      128
2  Claire       75
Introdução à estatística em Python

Amostragem com substituição

GIF da mão na caixa, retirando o nome de Brian e colocando-o de volta

Introdução à estatística em Python

Amostragem com substituição

Captura de tela 2020-04-28 at 5.21.54 PM.png

$$P(\text{Claire}) = \frac{1}{4} = 25\%$$

Introdução à estatística em Python

Amostragem com/sem substituição em Python

sales_counts.sample(5, replace = True)
     name  n_sales
1   Brian      128
2  Claire       75
1   Brian      128
3  Damian       69
0    Amir      178
Introdução à estatística em Python

Eventos independentes

Dois eventos são independentes se a probabilidade do segundo evento não for afetada pelo resultado do primeiro evento.

Duas colunas: Primeira coluna contendo Amir, Brian, Claire e Damian. A segunda coluna está vazia

Introdução à estatística em Python

Eventos independentes

Dois eventos são independentes se a probabilidade do segundo evento não for afetada pelo resultado do primeiro evento.

 

Amostragem com reposição = cada seleção é independente

As setas de cada nome na primeira coluna apontam para Claire na segunda coluna, com probabilidade de 25%

Introdução à estatística em Python

Eventos dependentes

Dois eventos são dependentes se a probabilidade do segundo evento for afetada pelo resultado do primeiro evento.

Duas colunas: Primeira coluna contendo Amir, Brian, Claire e Damian. A segunda coluna está vazia

Introdução à estatística em Python

Eventos dependentes

Dois eventos são dependentes se a probabilidade do segundo evento for afetada pelo resultado do primeiro evento.

Claire na primeira coluna aponta para Claire na segunda coluna com probabilidade de 0%

Introdução à estatística em Python

Eventos dependentes

Dois eventos são dependentes se a probabilidade do segundo evento for afetada pelo resultado do primeiro evento.

 

Amostragem sem reposição → escolhas se tornam dependentes

Amir, Brian e Damian na primeira coluna apontam para Claire na segunda coluna com probabilidade de 33%

Introdução à estatística em Python

Vamos praticar!

Introdução à estatística em Python

Preparing Video For Download...