Hoe bouw je een GLM?

Generalized Linear Models in Python

Ita Cirovic Donev

Data Science Consultant

Componenten van de GLM

Formulevoorstelling voor de willekeurige component

Generalized Linear Models in Python

Componenten van de GLM

Formulevoorstelling voor de willekeurige en systematische component

Generalized Linear Models in Python

Componenten van de GLM

Formulevoorstelling voor de willekeurige en systematische component met illustratie van het interactie-effect.

Generalized Linear Models in Python

Componenten van de GLM

Formulevoorstelling voor de willekeurige en systematische component met illustratie van het interactie- en kromlijnig effect.

Generalized Linear Models in Python

Componenten van de GLM

Formulevoorstelling voor de willekeurige en systematische component en de linkfunctie

Generalized Linear Models in Python

Continu $\rightarrow$ lineaire regressie

Verdelingsgrafiek van de continue toevalsvariabele.

Datatype: continu
Domein: $(-\infty,\infty)$
Voorbeelden: huizenprijs, salaris, lichaamslengte

Familie: Gaussian()
Link: identiteit
$g(\mu) = \mu = E(y)$

Model = Lineaire regressie

Generalized Linear Models in Python

Binair $\rightarrow$ logistische regressie

Verdelingsgrafiek van de binaire toevalsvariabele.

Datatype: binair
Domein: $0,1$
Voorbeelden: Waar/Onwaar

Familie: Binomial()
Link: logit

Model = Logistische regressie

Generalized Linear Models in Python

Telling $\rightarrow$ Poisson-regressie

Verdelingsgrafiek van telgegevens.

Datatype: telling
Domein: $0, 1, 2, ..., \infty$
Voorbeelden: aantal stemmen, aantal orkanen

Familie: Poisson()
Link: logaritme

Model = Poisson-regressie

Generalized Linear Models in Python

Linkfuncties

Dichtheid Link: $\eta=g(\mu)$ Standaardlink glm(family=...)
Normaal $\eta = \mu$ identiteit Gaussian()
Poisson $\eta = log(\mu)$ logaritme Poisson()
Binomiaal $\eta = log[p/(1-p)]$ logit Binomial()
Gamma $\eta = 1/\mu$ invers Gamma()
Inverse Gauss $\eta = 1/\mu^2$ kwadraatinvers InverseGaussian()
Generalized Linear Models in Python

Voordelen van GLM's

  • Één raamwerk voor veel verschillende verdelingen
    • Exponentiële familie van verdelingen
  • Linkfunctie
    • Transformeert de verwachtingswaarde van y
    • Maakt lineaire combinaties mogelijk
    • Veel technieken uit lineaire modellen gelden ook voor GLM's
Generalized Linear Models in Python

Laten we oefenen!

Generalized Linear Models in Python

Preparing Video For Download...