Generalized Linear Models in Python
Ita Cirovic Donev
Data Science Consultant
Voorbeelden:
ONGEGROEPEERD
GROEPEERD


Toetsuitkomst: $PASS=1$ of $FAIL=0$
We willen modelleren
$P(y=1)=\beta_0 + \beta_1x_1$
$P(\text{Pass})=\beta_0 + \beta_1 \times \text{Uren studeren}$

Toetsuitkomst: $PASS=1$ of $FAIL=0$
We willen modelleren
$P(y=1)=\beta_0 + \beta_1x_1$
$P(\text{Pass})=\beta_0 + \beta_1 \times \text{Uren studeren}$
$f(z) = \frac{1}{(1+\exp(-z))}$
$$ ODDS = \frac{\text{gebeurtenis treedt op}}{\text{gebeurtenis treedt NIET op}} $$
$$ \text{ODDS RATIO} = \frac{odds 1}{odds 2} $$
4 wedstrijden

Odds zijn 3 tegen 1

$$ \text{odds} \neq \text{kans} $$
$$ \text{odds} = \frac{\text{kans}}{1-\text{kans}} $$
$$ \text{kans} = \frac{\text{odds}}{1+\text{odds}} $$
Stap 1. Kansmodel
$E(y)=\mu=P(y=1)=\beta_0 + \beta_1x_1$
Stap 2. Logistische functie
$f(z) = \large{\frac{1}{(1+\exp(-z))}}$
Stap 3. Pas logistische functie toe $\rightarrow$ INVERSE-LOGIT
$\mu = \large{\frac{1}{1+\exp(-(\beta_0+\beta_1x_1))}} = \large{\frac{\exp(\beta_0+\beta_1x_1)}{1+\exp(\beta_0+\beta_1x_1)}}$
$1-\mu = \large{\frac{1}{1+\exp(\beta_0+\beta_1x_1)}}$
$$ LOGIT(\mu)=log(\frac{\mu}{1-\mu}) = \beta_0+\beta_1x_1 $$
Functie - glm()
model_GLM = glm(formula = 'y ~ x',
data = my_data,
family = sm.families.Binomial()).fit
Input
y = [0,1,1,0,...]
y = ['No','Yes','Yes',...]
y = ['Fail','Pass','Pass',...]
Generalized Linear Models in Python