Plan d’expériences

Introduction aux statistiques en Python

Maggie Matsui

Content Developer, DataCamp

Vocabulaire

L’expérience vise à répondre à cette question : quel est l’effet du traitement sur la réponse ?

  • Traitement : variable explicative/indépendante
  • Réponse : variable de réponse/dépendante

 

Par exemple, quel est l’effet d’une publicité sur le nombre de produits achetés ?

  • Traitement : publicité
  • Réponse : nombre de produits achetés
Introduction aux statistiques en Python

Expériences contrôlées

  • Les participants sont assignés par les chercheurs à un groupe de traitement ou à un groupe de contrôle
    • Le groupe de traitement voit la publicité
    • Le groupe de contrôle ne la voit pas
  • Les groupes doivent être comparables afin de pouvoir déduire un lien de causalité
  • Si les groupes ne sont pas comparables, cela peut entraîner des confusions (biais)
    • Âge moyen du groupe de traitement : 25
    • Âge moyen du groupe de contrôle : 50
    • L’âge est un facteur de confusion potentiel
Introduction aux statistiques en Python

La référence absolue des expériences utilisera...

  • Des essais contrôlés randomisés

    • Les participants sont assignés aléatoirement aux groupes de traitement et de contrôle, et non en fonction d’autres caractéristiques
    • Le choix aléatoire permet de s’assurer que les groupes sont comparables
  • Un placebo

    • Ressemble au traitement, mais n’a pas d’effet
    • Les participants ne savent pas dans quel groupe ils se trouvent
    • Dans les essais cliniques, une pilule de sucre permet de s’assurer que l’effet du médicament est bien dû au médicament lui-même et non à l’idée de recevoir le médicament
Introduction aux statistiques en Python

La référence absolue des expériences utilisera...

  • Un essai en double aveugle
    • La personne qui administre le traitement ou réalise l’étude ne sait pas si le traitement est réel ou s’il s’agit d’un placebo
    • Empêche les biais dans la réponse et/ou l’analyse des résultats

 

Moins de possibilités de biais = conclusion plus fiable sur le lien de causalité

Introduction aux statistiques en Python

Études d’observation

  • Les participants ne sont pas répartis de manière aléatoire dans les groupes

    • L’appartenance à un groupe dépend généralement de caractéristiques préexistantes des participants
  • De nombreuses questions de recherche ne se prêtent pas à une expérience contrôlée

    • Vous ne pouvez pas forcer quelqu’un à fumer ou à avoir une maladie
    • Vous ne pouvez pas obliger quelqu’un à avoir un certain comportement dans le passé
  • Établissent une relation, pas un lien de causalité
    • Les effets peuvent être confondus par d’autres facteurs liés à l’appartenance au groupe de contrôle ou de traitement
    • Il existe des moyens de contrôler les facteurs de confusion afin d’obtenir des conclusions plus fiables sur la relation
Introduction aux statistiques en Python

Études longitudinales et transversales

Étude longitudinale

  • Les participants sont suivis pendant un certain temps afin d’examiner l’effet du traitement sur la réponse
  • L’effet de l’âge sur la taille n’est pas confondu par la génération
  • Plus cher, résultats plus longs

Étude transversale

  • Les données sur les participants sont collectées à partir d’un seul point dans le temps
  • L’effet de l’âge sur la taille est confondu par la génération
  • Moins cher, plus rapide, plus pratique
Introduction aux statistiques en Python

Passons à la pratique !

Introduction aux statistiques en Python

Preparing Video For Download...