Come costruire un GLM?

Modelli lineari generalizzati in Python

Ita Cirovic Donev

Data Science Consultant

Componenti del GLM

Rappresentazione della formula per la componente casuale

Modelli lineari generalizzati in Python

Componenti del GLM

Rappresentazione della formula per le componenti casuale e sistematica

Modelli lineari generalizzati in Python

Componenti del GLM

Rappresentazione della formula per le componenti casuale e sistematica con illustrazione dell'effetto di interazione.

Modelli lineari generalizzati in Python

Componenti del GLM

Rappresentazione della formula per le componenti casuale e sistematica con illustrazione dell'effetto di interazione e curvilineo.

Modelli lineari generalizzati in Python

Componenti del GLM

Rappresentazione della formula per le componenti casuale e sistematica e la funzione di link

Modelli lineari generalizzati in Python

Continuo $\rightarrow$ Regressione lineare

Grafico della distribuzione di una variabile casuale continua.

Tipo di dato: continuo
Dominio: $(-\infty,\infty)$
Esempi: prezzo casa, stipendio, altezza

Famiglia: Gaussian()
Link: identità
$g(\mu) = \mu = E(y)$

Modello = Regressione lineare

Modelli lineari generalizzati in Python

Binario $\rightarrow$ Regressione logistica

Grafico della distribuzione di una variabile casuale binaria.

Tipo di dato: binario
Dominio: $0,1$
Esempi: Vero/Falso

Famiglia: Binomial()
Link: logit

Modello = Regressione logistica

Modelli lineari generalizzati in Python

Conteggio $\rightarrow$ Regressione di Poisson

Grafico della distribuzione dei conteggi.

Tipo di dato: conteggio
Dominio: $0, 1, 2, ..., \infty$
Esempi: numero di voti, numero di uragani

Famiglia: Poisson()
Link: logaritmo

Modello = Regressione di Poisson

Modelli lineari generalizzati in Python

Funzioni di link

Densità Link: $\eta=g(\mu)$ Link predef. glm(family=...)
Normale $\eta = \mu$ identità Gaussian()
Poisson $\eta = log(\mu)$ logaritmo Poisson()
Binomiale $\eta = log[p/(1-p)]$ logit Binomial()
Gamma $\eta = 1/\mu$ inverso Gamma()
Gaussiana inversa $\eta = 1/\mu^2$ inverso al quadrato InverseGaussian()
Modelli lineari generalizzati in Python

Vantaggi dei GLM

  • Un quadro unico per molte distribuzioni
    • Famiglia esponenziale di distribuzioni
  • Funzione di link
    • Trasforma il valore atteso di y
    • Permette combinazioni lineari
    • Molte tecniche dei modelli lineari valgono anche per i GLM
Modelli lineari generalizzati in Python

Passiamo alla pratica !

Modelli lineari generalizzati in Python

Preparing Video For Download...