Inferentie van modellen interpreteren

Generalized Linear Models in Python

Ita Cirovic Donev

Data Science Consultant

Schatting van de betacoëfficiënt

  • Maximum likelihood (MLE)
  • Geschatte coëfficiënt, $\hat\beta$
    • log-likelihood is maximaal

Likelihoodfunctie

Generalized Linear Models in Python

Schatting van de betacoëfficiënt

  • Iteratief gewogen kleinste kwadraten (IRLS)

Samenvattende output van het passende model

Generalized Linear Models in Python

Significantietoetsing

Samenvattende output van het passende model met gemarkeerde statistieken voor coëfficiëntschatting.

Generalized Linear Models in Python

Standaardfout (SE)

  • Vlakker maximum
    $\rightarrow$ Locatie van maximum lastiger te bepalen
    $\rightarrow$ Grotere SE

Visualisatie van de likelihood bij grotere standaardfout.

  • Scherper maximum
    $\rightarrow$ Locatie van maximum duidelijker
    $\rightarrow$ Kleinere SE

Visualisatie van de likelihood bij kleinere standaardfout.

Generalized Linear Models in Python

Berekening van de standaardfout

# Extract variance-covariance matrix
print(model_GLM.cov_params())
           Intercept    weight
Intercept   0.774762 -0.325087
weight     -0.325087  0.141903
# Compute standard error for weight
std_error = np.sqrt(0.141903)
0.3767

Variantie-covariantiematrix

Illustratie van de variantie-covariantiematrix

Generalized Linear Models in Python

Significantietoetsing

  • z-statistiek $$ \color{#2485F2}{z=\hat\beta/SE} $$

  • Grote $\color{#2485F2}{z}$ $\Rightarrow$ coëfficiënt $\ne0$ $\Rightarrow$ variabele significant

  • Vuistregel: afkappunt 2

Voorbeeld: model voor de hoefijzerkrab
y ~ weight

$z = 1.8151/0.377 = 4.819$

Generalized Linear Models in Python

Betrouwbaarheidsintervallen voor beta

  • Onzekerheid van schattingen
  • 95%-betrouwbaarheidsintervallen voor $\beta$

$$ [\color{#5A5AF3}{onder},\color{#D8498E}{boven}] $$

$$ [\color{#5A5AF3}{\hat\beta - 1.96 \times SE},\color{#D8498E}{\hat\beta+1.96 \times SE}] $$

Generalized Linear Models in Python

Betrouwbaarheidsintervallen berekenen

Voorbeeld: model voor de hoefijzerkrab

                 coef    std err   
<hr />-------------------------------
Intercept     -3.6947      0.880  
weight         1.8151      0.377  

Generalized Linear Models in Python

Betrouwbaarheidsintervallen ophalen

print(model_GLM.conf_int())
                  0         1
Intercept -5.419897 -1.969555
weight     1.076826  2.553463
Generalized Linear Models in Python

Betrouwbaarheidsintervallen ophalen

print(model_GLM.conf_int())
              lower         1
Intercept -5.419897 -1.969555
weight     1.076826  2.553463
Generalized Linear Models in Python

Betrouwbaarheidsintervallen ophalen

print(model_GLM.conf_int())
                  0     upper
Intercept -5.419897 -1.969555
weight     1.076826  2.553463
Generalized Linear Models in Python

Betrouwbaarheidsintervallen voor odds

  1. Haal betrouwbaarheidsintervallen voor $\beta$ op

  2. Exponentieer de grenzen

print(np.exp(model_GLM.conf_int()))
                  0          1
Intercept  0.004428   0.139519
weight     2.935348  12.851533
Generalized Linear Models in Python

Laten we oefenen!

Generalized Linear Models in Python

Preparing Video For Download...