Was ist Statistik?

Einführung in die Statistik in R

Maggie Matsui

Content Developer, DataCamp

Was ist Statistik?

  • Statistik – die Praxis und die Lehre der Erhebung und Analyse von Daten

  • Zusammenfassende Statistik – eine Information über oder Zusammenfassung von Daten

Einführung in die Statistik in R

Was ist Statistik?

  • Statistik – die Praxis und die Lehre der Erhebung und Analyse von Daten

  • Zusammenfassende Statistik – eine Information über oder Zusammenfassung von Daten

Was ist mit Statistik möglich?

  • Wie wahrscheinlich ist es, dass jemand ein Produkt kauft? Sind Menschen eher bereit zu kaufen, wenn sie ein anderes Zahlungssystem verwenden können?
  • Wie viele können in einem Hotel übernachten? Wie kannst du die Belegung optimieren?
  • Wie viele Jeansgrößen müssen hergestellt werden, damit sie 95 % der Bevölkerung passen? Sollte von jeder Größe die gleiche Anzahl produziert werden?
  • A/B-Tests: Welche Werbung ist effektiver darin, Menschen zum Kauf eines Produkts zu bewegen?
Einführung in die Statistik in R

Was kann die Statistik nicht leisten?

  • Warum ist Game of Thrones so beliebt?

Stattdessen...

  • Werden Serien mit mehr Gewaltszenen von mehr Menschen gesehen?

Aber...

  • Trotzdem sagt das nichts darüber aus, ob mehr Gewaltszenen zu mehr Zuschauern führen.
Einführung in die Statistik in R

Statistikarten

Deskriptive Statistik

  • Beschreibt und fasst Daten zusammen

2 Autos, 1 Bus, 1 Fahrrad

  • 50 % fahren mit dem Auto zur Arbeit
  • 25 % nehmen den Bus
  • 25 % nehmen das Fahrrad

Inferenzstatistik

  • Verwendet eine Stichprobe von Daten, um Rückschlüsse auf eine größere Population zu ziehen

2 Autos, 1 Bus, 1 Fahrrad umgeben von weiteren Autos, Bussen und Fahrrädern

Wie viel % fahren mit dem Auto zur Arbeit?

Einführung in die Statistik in R

Datenarten

Numerisch (quantitativ)

  • Kontinuierlich (gemessen)
    • Geschwindigkeit eines Flugzeugs
    • Zeit in der Warteschlange
  • Diskret (gezählt)
    • Anzahl von Haustieren
    • Anzahl versendeter Pakete

Kategorisch (qualitativ)

  • Nominal (ungeordnet)
    • Verheiratet/unverheiratet
    • Land des Wohnsitzes
  • Ordinal (geordnet)

stimme überhaupt nicht zu/stimme eher nicht zu/stimme weder zu noch lehne ich ab/stimme eher zu/stimme voll und ganz zu

Einführung in die Statistik in R

Kategoriale Daten als Zahlen darstellen

Nominal (ungeordnet)

  • Verheiratet/unverheiratet (1/0)
  • Land des Wohnsitzes (1, 2, ...)

Ordinal (geordnet)

  • Stimme überhaupt nicht zu (1)
  • Stimme eher nicht zu (2)
  • Stimme weder zu noch lehne ich ab (3)
  • Stimme eher zu (4)
  • Stimme voll und ganz zu (5)
Einführung in die Statistik in R

Warum ist die Art der Daten wichtig?

Zusammenfassende Statistiken
car_speeds %>% 
  summarize(avg_speed = mean(speed_mph))
  avg_speed
1  40.09062
Grafische Darstellung

Streudiagramm Geschwindigkeit vs. Fahrzeuggewicht

Einführung in die Statistik in R

Warum ist die Art der Daten wichtig?

Zusammenfassende Statistiken
demographics %>% 
  count(marriage_status)
  marriage_status     n
1          single   188
2         married   143
3        divorced   124
Grafische Darstellung

Balkendiagramm der Anzahl der Ehestände

Einführung in die Statistik in R

Lass uns üben!

Einführung in die Statistik in R

Preparing Video For Download...