Quais são as chances?

Introdução à Estatística em R

Maggie Matsui

Content Developer, DataCamp

Medindo a chance

Qual é a probabilidade de um evento?

$$ P(\text{event}) = \frac{\text{\# maneiras do evento ocorrer}}{\text{total de \# resultados possíveis}} $$

Exemplo: cara ou coroa

$$ P(\text{cara}) = \frac{\text{1 jeito de dar cara}}{\text{2 resultados possíveis}} = \frac{1}{2} = 50\%$$

Linha numérica de probabilidade. 0 por cento = impossível, 100 por cento = vai acontecer com certeza

Introdução à Estatística em R

Distribuindo vendedores

Caixa com os nomes de Amir, Brian, Claire e Damian

Introdução à Estatística em R

Distribuindo vendedores

Retirando o nome do Brian

$$P(\text{Brian}) = \frac{1}{4} = 25\%$$

Introdução à Estatística em R

Amostrando de um data frame

sales_counts
   name  n_sales
 1 Amir      178
 2 Brian     126
 3 Claire     75
 4 Damian     69
sales_counts %>%
  sample_n(1)
   name  n_sales
 1 Brian     126
sales_counts %>%
  sample_n(1)
   name  n_sales
 1 Claire     75
Introdução à Estatística em R

Definindo a semente aleatória

set.seed(5)

sales_counts %>% sample_n(1)
   name  n_sales
 1 Brian     126
set.seed(5)

sales_counts %>% sample_n(1)
   name  n_sales
 1 Brian     126
Introdução à Estatística em R

Uma segunda reunião

Amostragem sem reposição

Caixa com Amir, Claire, Damian

Introdução à Estatística em R

Uma segunda reunião

Nome da Claire retirado

$$P(\text{Claire}) = \frac{1}{3} = 33\%$$

Introdução à Estatística em R

Amostrando duas vezes no R

sales_counts %>%
  sample_n(2)
   name  n_sales
 1 Brian     126
 2 Claire     75
Introdução à Estatística em R

Amostragem com reposição

GIF de mão pegando o nome do Brian na caixa e colocando de volta

Introdução à Estatística em R

Amostragem com reposição

Captura de tela 28/04/2020 às 17:21:54

$$P(\text{Claire}) = \frac{1}{4} = 25\%$$

Introdução à Estatística em R

Amostragem com reposição no R

sales_counts %>%
  sample_n(2, replace = TRUE)
   name  n_sales
 1 Brian     126
 2 Claire     75

5 reuniões:

sample(sales_team, 5, replace = TRUE)
   name  n_sales
 1 Brian     126
 2 Claire     75
 3 Brian     126
 4 Brian     126
 5 Amir      178
Introdução à Estatística em R

Eventos independentes

Dois eventos são independentes se a probabilidade do segundo não é afetada pelo resultado do primeiro.

Duas colunas: primeira escolha com Amir, Brian, Claire, Damian. Segunda escolha vazia

Introdução à Estatística em R

Eventos independentes

Dois eventos são independentes se a probabilidade do segundo não é afetada pelo resultado do primeiro.

 

Amostragem com reposição = cada escolha é independente

Setas de cada nome na primeira coluna apontam para Claire na segunda, com probabilidade 25%

Introdução à Estatística em R

Eventos dependentes

Dois eventos são dependentes se a probabilidade do segundo é afetada pelo resultado do primeiro.

Duas colunas: primeira escolha com Amir, Brian, Claire, Damian. Segunda escolha vazia

Introdução à Estatística em R

Eventos dependentes

Dois eventos são dependentes se a probabilidade do segundo é afetada pelo resultado do primeiro.

Claire na primeira coluna aponta para Claire na segunda com probabilidade 0%

Introdução à Estatística em R

Eventos dependentes

Dois eventos são dependentes se a probabilidade do segundo é afetada pelo resultado do primeiro.

 

Amostragem sem reposição = cada escolha é dependente

Amir, Brian e Damian na primeira coluna apontam para Claire na segunda com probabilidade 33%

Introdução à Estatística em R

Vamos praticar!

Introdução à Estatística em R

Preparing Video For Download...