Quelles sont les chances ?

Introduction aux statistiques en Python

Maggie Matsui

Content Developer, DataCamp

Mesurer les chances

Quelle est la probabilité d’un événement ?

$$ P(\text{événement}) = \frac{\text{nombre de manières d'obtenir l'événement}}{\text{nombre total de résultats possibles}} $$

Exemple : pile ou face

$$ P(\text{face}) = \frac{\text{1 manière d'obtenir face}}{\text{2 résultats possibles}} = \frac{1}{2} = 50 \%$$

Ligne numérique de probabilité. 0 % = impossible, 100 % = se produira certainement

Introduction aux statistiques en Python

Affectation des vendeurs

Boîte avec les noms d’Amir, Brian, Claire et Damian

Introduction aux statistiques en Python

Affectation des vendeurs

On tire le nom de Brian

$$P(\text{Brian}) = \frac{1}{4} = 25 \%$$

Introduction aux statistiques en Python

Echantillonnage à partir d’un DataFrame

print(sales_counts)
     name  n_sales
0    Amir      178
1   Brian      128
2  Claire       75
3  Damian       69
sales_counts.sample()
    name  n_sales
1  Brian      128
sales_counts.sample()
     name  n_sales
2  Claire       75
Introduction aux statistiques en Python

Définition d’une graine aléatoire

np.random.seed(10)

sales_counts.sample()
    name  n_sales
1  Brian      128
np.random.seed(10)
sales_counts.sample()
    name  n_sales
1  Brian      128
np.random.seed(10)
sales_counts.sample()
    name  n_sales
1  Brian      128
Introduction aux statistiques en Python

Une deuxième réunion

Échantillonnage sans remise

Boîte avec Amir, Claire, Damian

Introduction aux statistiques en Python

Une deuxième réunion

Le nom de Claire a été retiré

$$P(\text{Claire}) = \frac{1}{3} = 33 \%$$

Introduction aux statistiques en Python

Échantillonner deux fois en Python

sales_counts.sample(2)
     name  n_sales
1   Brian      128
2  Claire       75
Introduction aux statistiques en Python

Échantillonnage avec remise

GIF d’une main plongeant dans la boîte, qui sort le nom de Brian, puis le remet dans la boîte

Introduction aux statistiques en Python

Échantillonnage avec remise

Screen Shot 2020-04-28 at 5.21.54 PM.png

$$P(\text{Claire}) = \frac{1}{4} = 25 \%$$

Introduction aux statistiques en Python

Echantillonnage avec/sans remise en Python

sales_counts.sample(5, replace = True)
     name  n_sales
1   Brian      128
2  Claire       75
1   Brian      128
3  Damian       69
0    Amir      178
Introduction aux statistiques en Python

Événements indépendants

Deux événements sont indépendants si la probabilité du deuxième événement n’est pas affectée par le résultat du premier.

Deux colonnes : Colonne de premier choix contenant Amir, Brian, Claire, Damian. La colonne de deuxième choix est vide

Introduction aux statistiques en Python

Événements indépendants

Deux événements sont indépendants si la probabilité du deuxième événement n’est pas affectée par le résultat du premier.

 

Échantillonnage avec remise : chaque choix est indépendant

Les flèches partant de chaque nom dans la première colonne de sélection pointent vers Claire dans la deuxième colonne de sélection, avec une probabilité de 25 %

Introduction aux statistiques en Python

Événements dépendants

Deux événements sont dépendants si la probabilité du deuxième événement est affectée par le résultat du premier.

Deux colonnes : Colonne de premier choix contenant Amir, Brian, Claire, Damian. La colonne de deuxième choix est vide

Introduction aux statistiques en Python

Événements dépendants

Deux événements sont dépendants si la probabilité du deuxième événement est affectée par le résultat du premier.

Claire dans la première colonne pointe vers Claire dans la deuxième colonne avec une probabilité de 0 %

Introduction aux statistiques en Python

Événements dépendants

Deux événements sont dépendants si la probabilité du deuxième événement est affectée par le résultat du premier.

 

Échantillonnage sans remise : les choix deviennent dépendants

Amir, Brian et Damian dans la première colonne pointent vers Claire dans la deuxième colonne avec une probabilité de 33 %

Introduction aux statistiques en Python

Passons à la pratique !

Introduction aux statistiques en Python

Preparing Video For Download...