¿Qué probabilidad hay?

Introducción a la estadística en R

Maggie Matsui

Content Developer, DataCamp

Medir la probabilidad

¿Cuál es la probabilidad de un suceso?

$$ P(\text{event}) = \frac{\text{\# ways event can happen}}{\text{total \# of possible outcomes}} $$

Ejemplo: lanzar una moneda

$$ P(\text{heads}) = \frac{\text{1 way to get heads}}{\text{2 possible outcomes}} = \frac{1}{2} = 50\%$$

Línea numérica de probabilidad. 0 por ciento = imposible, 100 por ciento = ocurrirá con toda seguridad

Introducción a la estadística en R

Asignación de vendedores

Caja con los nombres de Amir, Brian, Claire y Damian

Introducción a la estadística en R

Asignación de vendedores

Se saca el nombre de Brian

$$P(\text{Brian}) = \frac{1}{4} = 25\%$$

Introducción a la estadística en R

Muestreo a partir de un marco de datos

sales_counts
   name  n_sales
 1 Amir      178
 2 Brian     126
 3 Claire     75
 4 Damian     69
sales_counts %>%
  sample_n(1)
   name  n_sales
 1 Brian     126
sales_counts %>%
  sample_n(1)
   name  n_sales
 1 Claire     75
Introducción a la estadística en R

Establecer una semilla aleatoria

set.seed(5)

sales_counts %>% sample_n(1)
   name  n_sales
 1 Brian     126
set.seed(5)

sales_counts %>% sample_n(1)
   name  n_sales
 1 Brian     126
Introducción a la estadística en R

Una segunda reunión

Muestreo sin sustitución

Caja con Amir, Claire, Damian

Introducción a la estadística en R

Una segunda reunión

Se saca el nombre de Claire

$$P(\text{Claire}) = \frac{1}{3} = 33\%$$

Introducción a la estadística en R

Muestreo dos veces en R

sales_counts %>%
  sample_n(2)
   name  n_sales
 1 Brian     126
 2 Claire     75
Introducción a la estadística en R

Muestreo con sustitución

GIF de una mano que se mete en la caja, saca el nombre de Brian y lo vuelve a meter

Introducción a la estadística en R

Muestreo con sustitución

Screen Shot 2020-04-28 at 5.21.54 PM.png

$$P(\text{Claire}) = \frac{1}{4} = 25\%$$

Introducción a la estadística en R

Muestreo con reemplazo en R

sales_counts %>%
  sample_n(2, replace = TRUE)
   name  n_sales
 1 Brian     126
 2 Claire     75

5 reuniones:

sample(sales_team, 5, replace = TRUE)
   name  n_sales
 1 Brian     126
 2 Claire     75
 3 Brian     126
 4 Brian     126
 5 Amir      178
Introducción a la estadística en R

Sucesos independientes

Dos sucesos son independientes si la probabilidad del segundo suceso no se ve afectada por el resultado del primero.

Hay dos columnas: la primera columna de selección contiene Amir, Brian, Claire, Damian. La segunda columna de selección está vacía.

Introducción a la estadística en R

Sucesos independientes

Dos sucesos son independientes si la probabilidad del segundo suceso no se ve afectada por el resultado del primero.

 

Muestreo con sustitución = cada selección es independiente

Las flechas de cada nombre de la primera columna apuntan a Claire en la segunda columna, con una probabilidad del 25 %.

Introducción a la estadística en R

Hechos dependientes

Dos sucesos son dependientes si la probabilidad del segundo suceso se ve afectada por el resultado del primero.

Hay dos columnas: la primera columna de selección contiene Amir, Brian, Claire, Damian. La segunda columna de selección está vacía.

Introducción a la estadística en R

Hechos dependientes

Dos sucesos son dependientes si la probabilidad del segundo suceso se ve afectada por el resultado del primero.

Claire en la primera columna señala a Claire en la segunda columna con una probabilidad del 0 %.

Introducción a la estadística en R

Hechos dependientes

Dos sucesos son dependientes si la probabilidad del segundo suceso se ve afectada por el resultado del primero.

 

Muestreo sin sustitución = cada selección es dependiente

Amir, Brian y Damian en la primera columna señalan a Claire en la segunda columna con una probabilidad del 33 %.

Introducción a la estadística en R

¡Vamos a practicar!

Introducción a la estadística en R

Preparing Video For Download...