Interpretare l'inferenza del modello

Modelli lineari generalizzati in Python

Ita Cirovic Donev

Data Science Consultant

Stima del coefficiente beta

  • Massima verosimiglianza (MLE)
  • Coefficiente stimato, $\hat\beta$
    • il log-verosimiglianza assume il valore massimo

Funzione di verosimiglianza

Modelli lineari generalizzati in Python

Stima del coefficiente beta

  • Minimi quadrati ripesati iterativamente (IRLS)

Riepilogo dell'output del modello adattato

Modelli lineari generalizzati in Python

Test di significatività

Output riassuntivo del modello con statistiche sull'analisi dei coefficienti evidenziate.

Modelli lineari generalizzati in Python

Errore standard (SE)

  • Picco più piatto
    $\rightarrow$ massimo meno definito
    $\rightarrow$ SE maggiore

Visualizzazione della verosimiglianza con errore standard maggiore.

  • Picco più acuto
    $\rightarrow$ massimo più definito
    $\rightarrow$ SE minore

Visualizzazione della verosimiglianza con errore standard minore.

Modelli lineari generalizzati in Python

Calcolo dell'errore standard

# Extract variance-covariance matrix
print(model_GLM.cov_params())
           Intercept    weight
Intercept   0.774762 -0.325087
weight     -0.325087  0.141903
# Compute standard error for weight
std_error = np.sqrt(0.141903)
0.3767

Matrice varianza-covarianza

Illustrazione della matrice varianza-covarianza

Modelli lineari generalizzati in Python

Test di significatività

  • Statistica z $$ \color{#2485F2}{z=\hat\beta/SE} $$

  • $\color{#2485F2}{z}$ grande $\Rightarrow$ coefficiente $\ne0$ $\Rightarrow$ variabile significativa

  • Regola pratica: soglia 2

Esempio: modello del granchio ferro di cavallo
y ~ weight

$z = 1.8151/0.377 = 4.819$

Modelli lineari generalizzati in Python

Intervalli di confidenza per beta

  • Incertezza delle stime
  • Intervalli di confidenza al 95% per $\beta$

$$ [\color{#5A5AF3}{basso},\color{#D8498E}{alto}] $$

$$ [\color{#5A5AF3}{\hat\beta - 1.96 \times SE},\color{#D8498E}{\hat\beta+1.96 \times SE}] $$

Modelli lineari generalizzati in Python

Calcolo degli intervalli di confidenza

Esempio: modello del granchio ferro di cavallo

                 coef    std err   
<hr />-------------------------------
Intercept     -3.6947      0.880  
weight         1.8151      0.377  

Modelli lineari generalizzati in Python

Estrai gli intervalli di confidenza

print(model_GLM.conf_int())
                  0         1
Intercept -5.419897 -1.969555
weight     1.076826  2.553463
Modelli lineari generalizzati in Python

Estrai gli intervalli di confidenza

print(model_GLM.conf_int())
              lower         1
Intercept -5.419897 -1.969555
weight     1.076826  2.553463
Modelli lineari generalizzati in Python

Estrai gli intervalli di confidenza

print(model_GLM.conf_int())
                  0     upper
Intercept -5.419897 -1.969555
weight     1.076826  2.553463
Modelli lineari generalizzati in Python

Intervalli di confidenza per gli odds

  1. Estrai gli intervalli di confidenza per $\beta$

  2. Esponi gli estremi

print(np.exp(model_GLM.conf_int()))
                  0          1
Intercept  0.004428   0.139519
weight     2.935348  12.851533
Modelli lineari generalizzati in Python

Andiamo a praticare!

Modelli lineari generalizzati in Python

Preparing Video For Download...