Variabili categoriche e termini d’interazione

Modelli lineari generalizzati in Python

Ita Cirovic Donev

Data Science Consultant

Variabili categoriche

  • Variabile binaria semplice
    • Yes, No
  • Variabili nominali
    • Colore: red, green, blue
  • Variabili ordinali
    • Istruzione: Education1, Education2,...,Education4
Modelli lineari generalizzati in Python

Analisi della covarianza

  • Variabili esplicative

    • $x_1$: categorica (binaria)
    • $x_2$: continua
  • Modello logistico $$ \text{logit}(y=1|X)=\beta_0 + \beta_1x_1 + \beta_2x_2 $$

Modelli lineari generalizzati in Python

Analisi della covarianza

  • Variabili esplicative
    • $x_1$: categorica (binaria)
    • $x_2$: continua
  • Modello logistico $$ \text{logit}(y=1|\color{red}{X})=\beta_0 + \beta_1\color{red}{x_1} + \beta_2\color{red}{x_2} $$
Modelli lineari generalizzati in Python

Analisi della covarianza

  • Variabili esplicative
    • $x_1$: categorica (binaria)
    • $x_2$: continua
  • Modello logistico $$ \text{logit}(y=1|X)=\beta_0 + \beta_1\color{red}{x_1} + \beta_2x_2 $$

  • Se $x_1=0$ allora $$ \text{logit}(y=1|\color{red}{x_1=0},x_2)=\beta_0 + \color{red}{0} + \beta_2x_2 $$

Modelli lineari generalizzati in Python

Analisi della covarianza

  • Variabili esplicative
    • $x_1$: categorica (binaria)
    • $x_2$: continua
  • Modello logistico $$ \text{logit}(y=1|X)=\beta_0 + \beta_1\color{red}{x_1} + \beta_2x_2 $$

  • Se $x_1=0$ allora $$ \text{logit}(y=1|x_1=0,x_2)=\beta_0 + 0 + \beta_2x_2 $$

  • Se $x_1 = 1$ allora $$ \text{logit}(y=1|\color{red}{x_1=1},x_2)=\beta_0 + \color{red}{\beta_1} + \beta_2x_2 $$ $$ \text{logit}(y=1|\color{red}{x_1=1},x_2)=(\beta_0 + \color{red}{\beta_1}) + \beta_2x_2 $$

Modelli lineari generalizzati in Python

Assunzioni

Visualizzazione del caso senza interazione con linee parallele.

Modelli lineari generalizzati in Python

Assunzioni

Evidenziare la differenza nell’intercetta in un modello senza interazione.

Modelli lineari generalizzati in Python

Assunzioni

Modello senza interazione

Linee non parallele che portano a un modello con termini d’interazione.

Modelli lineari generalizzati in Python

Interazioni

  • Pendenze diverse $\rightarrow$ c’è interazione
  • L’effetto di $x_1$ su $y$ dipende dal livello di $x_2$ e viceversa
  • Modello logistico con interazioni $$ \text{logit}(y=1|X)=\beta_0 + \beta_1x_1 + \beta_2x_2 + \color{red}{\beta_3x_1x_2} $$
Modelli lineari generalizzati in Python

Interazioni

  • Pendenze diverse $\rightarrow$ c’è interazione
  • L’effetto di $x_1$ su $y$ dipende dal livello di $x_2$ e viceversa
  • Modello logistico con interazioni $$ \text{logit}(y=1|X)=\beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 $$

  • Se $x_1=0$ allora $$ \text{logit}(y=1|\color{red}{x_1=0},x_2)=\beta_0 + \color{red}{0} + \beta_2x_2 + \color{red}{0} $$

Modelli lineari generalizzati in Python

Interazioni

  • Pendenze diverse $\rightarrow$ c’è interazione
  • L’effetto di $x_1$ su $y$ dipende dal livello di $x_2$ e viceversa
  • Modello logistico con interazioni $$ \text{logit}(y=1|X)=\beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 $$

  • Se $x_1=0$ allora $$ \text{logit}(y=1|x_1=0,x_2)=\beta_0 + \beta_2x_2 $$

  • Se $x_1 = 1$ allora $$ \text{logit}(y=1|\color{red}{x_1=1},x_2)=\beta_0 + \color{red}{\beta_1} + \beta_2x_2 + \color{red}{\beta_3}x_2 $$ $$ \text{logit}(y=1|\color{red}{x_1=1},x_2)=(\beta_0 + \color{red}{\beta_1}) + (\beta_2 + \color{red}{\beta_3})x_2 $$

Modelli lineari generalizzati in Python

Interazioni

  • Pendenze diverse $\rightarrow$ c’è interazione
  • L’effetto di $x_1$ su $y$ dipende dal livello di $x_2$ e viceversa
  • Modello logistico con interazioni $$ \text{logit}(y=1|X)=\beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 $$

  • Se $x_1=0$ allora $$ \text{logit}(y=1|x_1=0,x_2)=\color{red}{\beta_0} + \color{red}{\beta_2}x_2 $$

  • Se $x_1 = 1$ allora $$ \text{logit}(y=1|x_1=1,x_2)=\beta_0 + \beta_1 + \beta_2x_2 + \beta_3x_2 $$ $$ \text{logit}(y=1|x_1=1,x_2)=\color{red}{(\beta_0 + \beta_1)} + \color{red}{(\beta_2 + \beta_3)}x_2 $$

Modelli lineari generalizzati in Python

Visualizzare le interazioni

Rappresentazione di un modello con termine d’interazione (linee non parallele).

Le interazioni permettono:

  • intercetta e pendenza diverse per $x_1$
  • $\beta_1$: differenza tra le due intercette
  • $\beta_3$: differenza tra le due pendenze
Modelli lineari generalizzati in Python

Tipi di interazione

  • binaria $\times$ binaria
  • binaria $\times$ categorica
  • binaria $\times$ continua
  • continua $\times$ categorica
  • continua $\times$ continua
  • categorica $\times$ categorica
  • interazioni tra più di 2 variabili
Modelli lineari generalizzati in Python

Ayo berlatih!

Modelli lineari generalizzati in Python

Preparing Video For Download...