Mehr Wahrscheinlichkeitsverteilungen

Einführung in die Statistik in Python

Maggie Matsui

Content Developer, DataCamp

Exponentialverteilung

  • Wahrscheinlichkeit der Zeit zwischen Poisson-Ereignissen

  • Beispiele

    • Wahrscheinlichkeit von > 1 Tag zwischen den Adoptionen
    • Wahrscheinlichkeit von < 10 Minuten zwischen den Ankünften im Restaurant
    • Wahrscheinlichkeit von 6-8 Monaten zwischen Erdbeben
  • Verwendet auch Lambda (Rate)

  • Kontinuierlich (Zeit)

Einführung in die Statistik in Python

Kundenserviceanfragen

  • Im Durchschnitt wird alle 2 Minuten ein Kundendienst-Ticket erstellt
    • $\lambda$ = 0,5 Kundenservicetickets pro Minute erstellt

Exponentialverteilung mit Lambda = 0,5

Einführung in die Statistik in Python

Lambda in der Exponentialverteilung

3 Exponentialverteilungen mit Lambda = 0,5, Lambda = 1 und Lambda = 1,5

Einführung in die Statistik in Python

Erwartungswert der Exponentialverteilung

In Bezug auf die Rate (Poisson):

  • $\lambda$ = $0.5 \text{ requests}$ pro Minute

 

In Bezug auf die Zeit zwischen den Ereignissen (exponentiell):

  • $1/\lambda$ = 1 Anfrage pro $2 \text{ Minuten}$
  • $1/0.5$ = $2$
Einführung in die Statistik in Python

Wie lange dauert eine neue Anfrage?

 

from scipy.stats import expon
  • scale = $1/\lambda$ = $1/0.5$ = $2$

$P(\text{wait} < \text{1 min})$ =

expon.cdf(1, scale=2)
0.3934693402873666

$P(\text{wait} > \text{4 min})$ =

1- expon.cdf(4, scale=2)
0.1353352832366127

$P(\text{1 min} < \text{wait} < \text{4 min})$ =

expon.cdf(4, scale=2) - expon.cdf(1, scale=2)
0.4711953764760207
Einführung in die Statistik in Python

(Studentsche) t-Verteilung

  • Ähnliche Form wie bei der Normalverteilung

t-Verteilung und Normalverteilung auf denselben Achsen

Einführung in die Statistik in Python

Freiheitsgrade

  • Hat den Parameter Freiheitsgrade (df), der die Dicke der Enden beeinflusst
    • Niedriger df = dickere Enden, höhere Standardabweichung
    • Höherer df = näher an der Normalverteilung

3 t-Verteilungen mit df = 1, df = 5 und df = 10

Einführung in die Statistik in Python

Log-Normalverteilung

  • Variable, deren Logarithmus normalverteilt ist

  • Beispiele:

    • Länge von Schachpartien
    • Blutdruck bei Erwachsenen
    • Anzahl der Krankenhausaufenthalte während des SARS-Ausbruchs 2003

3 Log-Normalverteilungen mit sd = 0,5, sd = 1, und sd = 1,5

Einführung in die Statistik in Python

Lass uns üben!

Einführung in die Statistik in Python

Preparing Video For Download...