Distributions discrètes

Introduction aux statistiques en Python

Maggie Matsui

Content Developer, DataCamp

Les dés sont jetés

Dé à six faces

Introduction aux statistiques en Python

Les dés sont jetés

Chaque face d’un dé a une probabilité de 1/6

Introduction aux statistiques en Python

Choix des vendeurs

 

Noms dans une boîte, chacun avec une probabilité de 25 %

Introduction aux statistiques en Python

Distribution des probabilités

Décrit la probabilité de chaque résultat possible dans un scénario

Chaque face d’un dé a une probabilité de 1/6

 

Valeur attendue : la moyenne d’une distribution des probabilités

Valeur attendue d’un lancer de dé équitable = $(1 \times \frac{1}{6}) + (2 \times \frac{1}{6}) +(3 \times \frac{1}{6}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3,5$.

Introduction aux statistiques en Python

Visualisation d’une distribution des probabilités

Graphique avec une barre pour chaque nombre de 1 à 6, avec une hauteur de 1/6.

Introduction aux statistiques en Python

Probabilité = aire

$$P(\text{lancer de dé} \le 2) = ~?$$

Barres pour 1 et 2 surlignées

Introduction aux statistiques en Python

Probabilité = aire

$$P(\text{lancer de dé} \le 2) = 1/3$$

1/6 + 1/6 = 1/3

Introduction aux statistiques en Python

Dé irrégulier

dé à six faces dont deux faces comportent 3 points

Valeur attendue d’un lancer de dé irrégulier = $(1 \times \frac{1}{6}) +(2 \times 0) +(3 \times \frac{1}{3}) +(4 \times \frac{1}{6}) +(5 \times \frac{1}{6}) +(6 \times \frac{1}{6}) = 3,67$

Introduction aux statistiques en Python

Visualiser des probabilités non uniformes

Distribution de probabilité d’un dé irrégulier. Les barres 1, 4, 5 et 6 ont une hauteur de 1/6, la barre 2 a une hauteur de 0, la barre 3 a une hauteur de 1/3

Introduction aux statistiques en Python

Addition d’aires

$$P(\text{lancer de dé irrégulier} \le 2) = ~?$$

1/6 + 0

Introduction aux statistiques en Python

Addition d’aires

$$P(\text{lancer de dé irrégulier} \le 2) = 1/6$$

1/6 + 0

Introduction aux statistiques en Python

Distributions de probabilités discrètes

Décrit les probabilités pour des résultats discrets

Dé équitable

Graphique pour un dé équitable

                 Distribution uniforme discrète

 

Dé irrégulier

Graphique pour un dé irrégulier

Introduction aux statistiques en Python

Échantillonnage à partir de distributions discrètes

print(die)
  number      prob
0      1  0.166667
1      2  0.166667
2      3  0.166667
3      4  0.166667
4      5  0.166667
5      6  0.166667
np.mean(die['number'])
3.5
rolls_10 = die.sample(10, replace = True)
rolls_10
  number      prob
0      1  0.166667
0      1  0.166667
4      5  0.166667
1      2  0.166667
0      1  0.166667
0      1  0.166667
5      6  0.166667
5      6  0.166667
...
Introduction aux statistiques en Python

Visualisation d’un échantillon

rolls_10['number'].hist(bins=np.linspace(1,7,7)) 
plt.show()

histogramme de 10 lancers

Introduction aux statistiques en Python

Distribution de l’échantillon et distribution théorique

Échantillon de 10 lancers

histogramme de 10 lancers

np.mean(rolls_10['number']) = 3.0

Distribution théorique

 

distribution des probabilités d’un dé équitable

mean(die['number']) = 3.5

Introduction aux statistiques en Python

Un échantillon plus important

Échantillon de 100 lancers

histogramme de 100 lancers

np.mean(rolls_100['number']) = 3.4

Distribution théorique

 

distribution des probabilités d’un dé équitable

mean(die['number']) = 3.5

Introduction aux statistiques en Python

Un échantillon encore plus important

Échantillon de 1000 lancers

histogramme de 1000 lancers

np.mean(rolls_1000['number']) = 3.48

Distribution théorique

 

distribution des probabilités d’un dé équitable

mean(die['number']) = 3.5

Introduction aux statistiques en Python

La loi des grands nombres

Au fur et à mesure que la taille de votre échantillon augmente, la moyenne de l’échantillon se rapproche de la valeur attendue.

Taille de l’échantillon Moyenne
10 3,00
100 3,40
1000 3,48
Introduction aux statistiques en Python

Passons à la pratique !

Introduction aux statistiques en Python

Preparing Video For Download...