Meer kansverdelingen

Inleiding tot statistiek in Python

Maggie Matsui

Content Developer, DataCamp

Exponentiële verdeling

  • Kans op tijd tussen Poisson-gebeurtenissen

  • Voorbeelden

    • Kans op > 1 dag tussen adopties
    • Kans op < 10 minuten tussen restaurantbezoekers
    • Kans op 6–8 maanden tussen aardbevingen
  • Gebruikt ook lambda (rate)

  • Continu (tijd)

Inleiding tot statistiek in Python

Klantenserviceverzoeken

  • Gemiddeld wordt elke 2 minuten 1 supportticket aangemaakt
    • $\lambda$ = 0,5 supporttickets per minuut

Exponentiële verdeling met lambda = 0,5

Inleiding tot statistiek in Python

Lambda in exponentiële verdeling

3 exponentiële verdelingen met lambda = 0,5, lambda = 1 en lambda = 1,5

Inleiding tot statistiek in Python

Verwachtingswaarde van exponentiële verdeling

In termen van rate (Poisson):

  • $\lambda$ = $0.5 \text{ requests}$ per minuut

 

In termen van tijd tussen events (exponentieel):

  • $1/\lambda$ = 1 request per $2 \text{ minutes}$
  • $1/0.5$ = $2$
Inleiding tot statistiek in Python

Hoelang tot een nieuw verzoek?

 

from scipy.stats import expon
  • scale = $1/\lambda$ = $1/0.5$ = $2$

$P(\text{wait} < \text{1 min})$ =

expon.cdf(1, scale=2)
0.3934693402873666

$P(\text{wait} > \text{4 min})$ =

1- expon.cdf(4, scale=2)
0.1353352832366127

$P(\text{1 min} < \text{wait} < \text{4 min})$ =

expon.cdf(4, scale=2) - expon.cdf(1, scale=2)
0.4711953764760207
Inleiding tot statistiek in Python

(Student’s) t-verdeling

  • Lijkt qua vorm op de normale verdeling

t-verdeling en normale verdeling op dezelfde assen

Inleiding tot statistiek in Python

Vrijheidsgraden

  • Heeft parameter vrijheidsgraden (df) die de dikte van de staarten beïnvloedt
    • Lagere df = dikkere staarten, hogere standaardafwijking
    • Hogere df = dichter bij de normale verdeling

3 t-verdelingen met df = 1, df = 5 en df = 10

Inleiding tot statistiek in Python

Lognormale verdeling

  • Variabele waarvan de logaritme normaal verdeeld is

  • Voorbeelden:

    • Lengte van schaakpartijen
    • Bloeddruk bij volwassenen
    • Aantal ziekenhuisopnames tijdens de SARS-uitbraak in 2003

3 lognormale verdelingen met sd = 0,5, sd = 1 en sd = 1,5

Inleiding tot statistiek in Python

Laten we oefenen!

Inleiding tot statistiek in Python

Preparing Video For Download...