Planung von Experimenten

Einführung in die Statistik in Python

Maggie Matsui

Content Developer, DataCamp

Vokabeln

Das Experiment zielt darauf ab, diese Frage zu beantworten: Welchen Einfluss hat die Behandlung auf die Reaktion?

  • Behandlung: erklärende/unabhängige Variable
  • Reaktion: Antwort/abhängige Variable

 

z. B. Wie wirkt sich Werbung auf die Anzahl der gekauften Produkte aus?

  • Behandlung: Werbung
  • Reaktion: Anzahl der gekauften Produkte
Einführung in die Statistik in Python

Kontrolliertes Experiment

  • Die Teilnehmer werden von den Forschern entweder der Behandlungs- oder der Kontrollgruppe zugewiesen
    • Behandlungsgruppe sieht Werbung
    • Kontrollgruppe hat nicht
  • Die Gruppen sollten vergleichbar sein, damit ein kausaler Zusammenhang hergestellt werden kann
  • Wenn die Gruppen nicht vergleichbar sind, könnte dies zu einer Störung führen (Verzerrung)
    • Durchschnittsalter der Behandlungsgruppe: 25
    • Durchschnittsalter der Kontrollgruppe: 50
    • Das Alter ist ein potenzieller Störfaktor
Einführung in die Statistik in Python

Der Goldstandard der Experimente verwendet...

  • Randomisierte kontrollierte Studie

    • Die Teilnehmer werden nach dem Zufallsprinzip der Behandlungs- oder Kontrollgruppe zugewiesen, und nicht aufgrund anderer Merkmale
    • Die Auswahl nach dem Zufallsprinzip hilft sicherzustellen, dass die Gruppen vergleichbar sind
  • Placebo

    • Ähnelt der Behandlung, hat aber keine Wirkung
    • Die Teilnehmer wissen nicht, in welcher Gruppe sie sind
    • In klinischen Studien stellt eine Zuckerpille sicher, dass die Wirkung des Medikaments tatsächlich auf das Medikament selbst zurückzuführen ist und nicht auf die Vorstellung, das Medikament zu erhalten
Einführung in die Statistik in Python

Der Goldstandard der Experimente verwendet...

  • Doppelblindstudie
    • Die Person, die die Behandlung verabreicht bzw. die Studie durchführt, weiß nicht, ob es sich um eine echte Behandlung oder um ein Placebo handelt.
    • Verhindert Verzerrungen bei der Reaktion und/oder der Analyse der Ergebnisse

 

Weniger Möglichkeiten für Verzerrungen = verlässlichere Schlussfolgerung über die Kausalität

Einführung in die Statistik in Python

Beobachtungsstudien

  • Die Teilnehmer werden nicht zufällig den Gruppen zugewiesen

    • Die Teilnehmer ordnen sich selbst zu, in der Regel auf der Grundlage bereits vorhandener Merkmale
  • Viele Forschungsfragen eignen sich nicht für ein kontrolliertes Experiment

    • Niemand kann gezwungen werden zu rauchen oder eine Krankheit zu haben
    • Man kann niemandem ein bestimmtes Verhalten aus der Vergangenheit aufzwingen
  • Assoziation, nicht Kausalität nachweisen
    • Effekte können durch Faktoren, die bestimmte Personen in die Kontroll- oder Behandlungsgruppe gebracht haben, verfälscht werden
    • Es gibt Möglichkeiten, Störfaktoren zu kontrollieren, um zuverlässigere Schlussfolgerungen über Assoziationen zu erhalten
Einführung in die Statistik in Python

Längsschnittstudien vs. Querschnittstudien

Longitudinalstudie

  • Die Teilnehmer werden über einen bestimmten Zeitraum hinweg beobachtet, um die Auswirkungen der Behandlung auf die Reaktion zu untersuchen
  • Der Einfluss des Alters auf die Körpergröße wird nicht durch die Generation gestört
  • Teurer, Ergebnisse dauern länger

Querschnittsstudie

  • Die Daten der Teilnehmer werden in einer einzigen Momentaufnahme erhoben
  • Der Einfluss des Alters auf die Körpergröße wird durch die Generation gestört
  • Billiger, schneller, einfacher
Einführung in die Statistik in Python

Lass uns üben!

Einführung in die Statistik in Python

Preparing Video For Download...