Variabel kategorikal dan interaksi

Generalized Linear Models di Python

Ita Cirovic Donev

Data Science Consultant

Variabel kategorikal

  • Variabel biner sederhana
    • Yes, No
  • Variabel nominal
    • Warna: red, green, blue
  • Variabel ordinal
    • Tingkat pendidikan: Education1, Education2,...,Education4
Generalized Linear Models di Python

Analisis kovarians

  • Variabel penjelas

    • $x_1$: kategorikal (biner)
    • $x_2$: kontinu
  • Model logistik $$ \text{logit}(y=1|X)=\beta_0 + \beta_1x_1 + \beta_2x_2 $$

Generalized Linear Models di Python

Analisis kovarians

  • Variabel penjelas
    • $x_1$: kategorikal (biner)
    • $x_2$: kontinu
  • Model logistik $$ \text{logit}(y=1|\color{red}{X})=\beta_0 + \beta_1\color{red}{x_1} + \beta_2\color{red}{x_2} $$
Generalized Linear Models di Python

Analisis kovarians

  • Variabel penjelas
    • $x_1$: kategorikal (biner)
    • $x_2$: kontinu
  • Model logistik $$ \text{logit}(y=1|X)=\beta_0 + \beta_1\color{red}{x_1} + \beta_2x_2 $$

  • Jika $x_1=0$ maka $$ \text{logit}(y=1|\color{red}{x_1=0},x_2)=\beta_0 + \color{red}{0} + \beta_2x_2 $$

Generalized Linear Models di Python

Analisis kovarians

  • Variabel penjelas
    • $x_1$: kategorikal (biner)
    • $x_2$: kontinu
  • Model logistik $$ \text{logit}(y=1|X)=\beta_0 + \beta_1\color{red}{x_1} + \beta_2x_2 $$

  • Jika $x_1=0$ maka $$ \text{logit}(y=1|x_1=0,x_2)=\beta_0 + 0 + \beta_2x_2 $$

  • Jika $x_1 = 1$ maka $$ \text{logit}(y=1|\color{red}{x_1=1},x_2)=\beta_0 + \color{red}{\beta_1} + \beta_2x_2 $$ $$ \text{logit}(y=1|\color{red}{x_1=1},x_2)=(\beta_0 + \color{red}{\beta_1}) + \beta_2x_2 $$

Generalized Linear Models di Python

Asumsi

Visualisasi tanpa interaksi dengan garis paralel.

Generalized Linear Models di Python

Asumsi

Menyoroti perbedaan intersep pada model tanpa interaksi.

Generalized Linear Models di Python

Asumsi

Model tanpa interaksi

Garis tidak paralel menghasilkan model dengan interaksi.

Generalized Linear Models di Python

Interaksi

  • Kemiringan tidak sama $\rightarrow$ ada interaksi
  • Efek $x_1$ pada $y$ bergantung pada level $x_2$ dan sebaliknya
  • Model logistik dengan interaksi $$ \text{logit}(y=1|X)=\beta_0 + \beta_1x_1 + \beta_2x_2 + \color{red}{\beta_3x_1x_2} $$
Generalized Linear Models di Python

Interaksi

  • Kemiringan tidak sama $\rightarrow$ ada interaksi
  • Efek $x_1$ pada $y$ bergantung pada level $x_2$ dan sebaliknya
  • Model logistik dengan interaksi $$ \text{logit}(y=1|X)=\beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 $$

  • Jika $x_1=0$ maka $$ \text{logit}(y=1|\color{red}{x_1=0},x_2)=\beta_0 + \color{red}{0} + \beta_2x_2 + \color{red}{0} $$

Generalized Linear Models di Python

Interaksi

  • Kemiringan tidak sama $\rightarrow$ ada interaksi
  • Efek $x_1$ pada $y$ bergantung pada level $x_2$ dan sebaliknya
  • Model logistik dengan interaksi $$ \text{logit}(y=1|X)=\beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 $$

  • Jika $x_1=0$ maka $$ \text{logit}(y=1|x_1=0,x_2)=\beta_0 + \beta_2x_2 $$

  • Jika $x_1 = 1$ maka $$ \text{logit}(y=1|\color{red}{x_1=1},x_2)=\beta_0 + \color{red}{\beta_1} + \beta_2x_2 + \color{red}{\beta_3}x_2 $$ $$ \text{logit}(y=1|\color{red}{x_1=1},x_2)=(\beta_0 + \color{red}{\beta_1}) + (\beta_2 + \color{red}{\beta_3})x_2 $$

Generalized Linear Models di Python

Interaksi

  • Kemiringan tidak sama $\rightarrow$ ada interaksi
  • Efek $x_1$ pada $y$ bergantung pada level $x_2$ dan sebaliknya
  • Model logistik dengan interaksi $$ \text{logit}(y=1|X)=\beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 $$

  • Jika $x_1=0$ maka $$ \text{logit}(y=1|x_1=0,x_2)=\color{red}{\beta_0} + \color{red}{\beta_2}x_2 $$

  • Jika $x_1 = 1$ maka $$ \text{logit}(y=1|x_1=1,x_2)=\beta_0 + \beta_1 + \beta_2x_2 + \beta_3x_2 $$ $$ \text{logit}(y=1|x_1=1,x_2)=\color{red}{(\beta_0 + \beta_1)} + \color{red}{(\beta_2 + \beta_3)}x_2 $$

Generalized Linear Models di Python

Memvisualisasikan interaksi

Representasi model dengan interaksi (garis tidak paralel).

Interaksi memungkinkan:

  • intersep dan kemiringan berbeda untuk $x_1$
  • $\beta_1$: selisih dua intersep
  • $\beta_3$: selisih dua kemiringan
Generalized Linear Models di Python

Jenis interaksi

  • biner $\times$ biner
  • biner $\times$ kategorikal
  • biner $\times$ kontinu
  • kontinu $\times$ kategorikal
  • kontinu $\times$ kontinu
  • kategorikal $\times$ kategorikal
  • interaksi > 2 variabel
Generalized Linear Models di Python

Ayo berlatih!

Generalized Linear Models di Python

Preparing Video For Download...