Aufstellung von Hypothesen

Explorative Datenanalyse in Python

George Boorman

Curriculum Manager, DataCamp

Was wissen wir?

Grafik, die zeigt, wie viele Flüge die jeweilige Fluggesellschaft in verschiedenen Preisklassen anbietet, wobei Jet Airways die meisten First-Class-Tickets hat

Explorative Datenanalyse in Python

Was wissen wir?

sns.heatmap(planes.corr(numeric_only=True), annot=True)
plt.show()

Heatmap mit den Werten des Pearson-Korrelationskoeffizienten zwischen den Variablen im Flugzeug-Datensatz

Explorative Datenanalyse in Python

Scheinkorrelation

sns.scatterplot(data=planes, x="Duration", y="Price", hue="Total_Stops")
plt.show()

Streudiagramm mit Preis und Dauer, unter Berücksichtigung der Gesamtzahl der Zwischenstopps

Explorative Datenanalyse in Python

Woher wissen wir das?

Heatmap mit Korrelationskoeffizienten für die jeweilige Anzahl von Zwischenstopps

Explorative Datenanalyse in Python

Was ist wahr?

Schreibmaschine mit der Aufschrift „Fake News“

  • Würden Daten eines anderen Zeitpunkts die gleichen Ergebnisse liefern?

  • Beziehungen, Unterschiede und Muster erkennen:

    • Wir verwenden Hypothesentests.
  • Für Hypothesentests ist noch vor der Datenerhebung Folgendes erforderlich:

    • Definition einer Hypothese oder Frage
    • Auswahl der statistischen Testmethode
1 Bildnachweis: https://unsplash.com/@markuswinkler
Explorative Datenanalyse in Python

Verzerrte Ergebnisse

 

Büro mit Blick auf die Landebahn eines Flughafens

Lupe auf einem Balkendiagramm

Explorative Datenanalyse in Python

Aufstellung von Hypothesen

sns.barplot(data=planes, x="Airline", y="Duration")
plt.show()

Balkendiagramm zum Vergleich der Dauer je nach Fluggesellschaft

Explorative Datenanalyse in Python

Aufstellung von Hypothesen

sns.barplot(data=planes, x="Destination", y="Price")
plt.show()

Balkendiagramm, das den Durchschnittspreis zeigt

Explorative Datenanalyse in Python

Nächste Schritte

  • Unser Experiment planen

  • Dazu gehören Schritte wie:

    • Auswahl einer Stichprobe
    • Benötigte Anzahl der Datenpunkte berechnen
    • Auswahl einer statistischen Testmethode
Explorative Datenanalyse in Python

Lass uns üben!

Explorative Datenanalyse in Python

Preparing Video For Download...