Was ist Statistik?

Einführung in die Statistik in Python

Maggie Matsui

Content Developer, DataCamp

Was ist Statistik?

  • Statistik – die Praxis und das Studium der Erhebung und Analyse von Daten.

  • Zusammenfassende Statistik – eine Information über oder Zusammenfassung von Daten

Einführung in die Statistik in Python

Was ist mit Statistik möglich?

Was ist Statistik?

  • Statistik – die Praxis und das Studium der Erhebung und Analyse von Daten

  • Zusammenfassende Statistik – eine Information über oder Zusammenfassung von Daten

Was ist mit Statistik möglich?

  • Wie wahrscheinlich ist es, dass jemand ein Produkt kauft? Sind die Leute eher bereit zu kaufen, wenn sie ein anderes Zahlungssystem verwenden können?
  • Wie viele können in einem Hotel übernachten? Wie kannst du die Belegung optimieren?
  • Wie viele Jeansgrößen müssen hergestellt werden, damit sie 95 % der Bevölkerung passen? Sollte von jeder Größe die gleiche Anzahl produziert werden?
  • A/B-Tests: Welche Werbung ist effektiver darin, Menschen zum Kauf eines Produkts zu bewegen?
Einführung in die Statistik in Python

Was kann die Statistik nicht leisten?

  • Warum ist Game of Thrones so beliebt?

Stattdessen...

  • Werden Serien mit mehr Gewaltszenen von mehr Menschen gesehen?

Aber...

  • Trotzdem sagt das nichts darüber aus, ob mehr Gewaltszenen zu mehr Zuschauern führen.
Einführung in die Statistik in Python

Arten der Statistik

Deskriptive Statistik

  • Beschreiben und fassen Daten zusammen

2 Autos, 1 Bus, 1 Fahrrad

  • 50 % fahren mit dem Auto zur Arbeit
  • 25 % nehmen den Bus
  • 25 % nehmen das Fahrrad

Inferenzstatistik

  • Verwendet eine Stichprobe von Daten, um Rückschlüsse auf eine größere Population zu ziehen

2 Autos, 1 Bus, 1 Fahrrad umgeben von weiteren Autos, Bussen und Fahrrädern

Wie viel Prozent fahren mit dem Auto zur Arbeit?

Einführung in die Statistik in Python

Arten von Daten

Numerisch (quantitativ)

  • Kontinuierlich (gemessen)
    • Geschwindigkeit eines Flugzeugs
    • Zeit in der Warteschlange
  • Diskret (gezählt)
    • Anzahl von Haustieren
    • Anzahl versendeter Pakete

Kategorisch (qualitativ)

  • Nominal (ungeordnet)
    • Verheiratet/unverheiratet
    • Land des Wohnsitzes
  • Ordinal (geordnet)

stimme überhaupt nicht zu/stimme eher nicht zu/stimme weder zu noch lehne ich ab/stimme eher zu/stimme voll und ganz zu

Einführung in die Statistik in Python

Kategoriale Daten als Zahlen darstellen

Nominal (ungeordnet)

  • Verheiratet/unverheiratet (1/0)
  • Land des Wohnsitzes (1, 2, ...)

Ordinal (geordnet)

  • Stimme überhaupt nicht zu (1)
  • Stimme eher nicht zu (2)
  • Stimme weder zu noch lehne ich ab (3)
  • Stimme eher zu (4)
  • Stimme voll und ganz zu (5)
Einführung in die Statistik in Python

Warum ist die Art der Daten wichtig?

Zusammenfassende Statistiken
import numpy as np
np.mean(car_speeds['speed_mph'])
40.09062
Grafische Darstellung

Streudiagramm Geschwindigkeit vs. Fahrzeuggewicht

Einführung in die Statistik in Python

Warum ist die Art der Daten wichtig?

Zusammenfassende Statistiken
demographics['marriage_status'].value_counts()
single      188
married     143
divorced    124
dtype: int64
Grafische Darstellung

Balkendiagramm der Anzahl der Ehestände

Einführung in die Statistik in Python

Lass uns üben!

Einführung in die Statistik in Python

Preparing Video For Download...