Distributions discrètes

Introduction aux statistiques en R

Maggie Matsui

Content Developer, DataCamp

Les dés sont jetés

Dé à six faces

Introduction aux statistiques en R

Les dés sont jetés

Chaque face d’un dé a une probabilité de 1/6

Introduction aux statistiques en R

Choix des vendeurs

 

Noms dans une boîte, chacun avec une probabilité de 25 %

Introduction aux statistiques en R

Distribution des probabilités

Décrit la probabilité de chaque résultat possible dans un scénario

Chaque face d’un dé a une probabilité de 1/6

 

Valeur attendue : la moyenne d’une distribution des probabilités

Valeur attendue d’un lancer de dé équitable = $(1 \times \frac{1}{6}) + (2 \times \frac{1}{6}) +(3 \times \frac{1}{6}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3,5$.

Introduction aux statistiques en R

Visualisation d’une distribution des probabilités

Graphique avec une barre pour chaque nombre de 1 à 6, avec une hauteur de 1/6.

Introduction aux statistiques en R

Probabilité = aire

$$P(\text{die roll}) \le 2 = ~?$$

Barres pour 1 et 2 surlignées

Introduction aux statistiques en R

Probabilité = aire

$$P(\text{lancer de dé} \le 2) = 1/3$$

1/6 + 1/6 = 1/3

Introduction aux statistiques en R

Dé irrégulier

dé à six faces dont deux faces comportent 3 points

Valeur attendue d’un lancer de dé irrégulier = $(1 \times \frac{1}{6}) +(2 \times 0) +(3 \times \frac{1}{3}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3,67$

Introduction aux statistiques en R

Visualiser des probabilités non uniformes

Distribution de probabilité d’un dé irrégulier. Les barres 1, 4, 5 et 6 ont une hauteur de 1/6, la barre 2 a une hauteur de 0, la barre 3 a une hauteur de 1/3

Introduction aux statistiques en R

Addition d’aires

$$P(\text{uneven die roll}) \le 2 = ~?$$

1/6 + 0

Introduction aux statistiques en R

Addition d’aires

$$P(\text{uneven die roll}) \le 2 = 1/6$$

1/6 + 0

Introduction aux statistiques en R

Distributions de probabilités discrètes

Décrit la probabilité de résultats discrets

Dé équitable

die_plot.png

                           Distribution uniforme discrète

 

Dé irrégulier

uneven_die.png

Introduction aux statistiques en R

Échantillonnage à partir de distributions discrètes

die
   n
1  1
2  2
3  3
4  4
5  5
6  6
mean(die$n)
3.5
rolls_10 <- die %>%
  sample_n(10, replace = TRUE)
rolls_10
   n
1  1
2  1
3  5
4  2
5  1
6  1
7  6
8  6
...
Introduction aux statistiques en R

Visualisation d’un échantillon

ggplot(rolls_10, aes(n)) +
  geom_histogram(bins = 6)

Histogramme de 10 lancers

Introduction aux statistiques en R

Distribution de l’échantillon et distribution théorique

 

Échantillon de 10 lancers

histogramme de 10 lancers

mean(rolls_10$n) = 3.0

 

Distribution théorique

distribution des probabilités d’un dé équitable

mean(die$n) = 3.5

Introduction aux statistiques en R

Un échantillon plus important

 

Échantillon de 100 lancers

histogramme de 100 lancers

mean(rolls_100$n) = 3.36

 

Distribution théorique

distribution des probabilités d’un dé équitable

mean(die$n) = 3.5

Introduction aux statistiques en R

Un échantillon encore plus important

 

Échantillon de 1 000 lancers

Histogramme de 1 000 lancers

mean(rolls_1000$n) = 3.53

 

Distribution théorique

distribution des probabilités d’un dé équitable

mean(die$n) = 3.5

Introduction aux statistiques en R

La loi des grands nombres

Au fur et à mesure que la taille de votre échantillon augmente, la moyenne de l’échantillon se rapproche de la valeur attendue.

Taille de l’échantillon Moyenne
10 3,00
100 3,36
1 000 3,53
Introduction aux statistiques en R

Passons à la pratique !

Introduction aux statistiques en R

Preparing Video For Download...