Data hitung dan distribusi Poisson

Generalized Linear Models di Python

Ita Cirovic Donev

Data Science Consultant

Data hitung

  • Menghitung jumlah kejadian dalam unit waktu, jarak, area, atau volume tertentu

Contoh:

  • Gol dalam satu pertandingan sepak bola
  • Jumlah gempa
  • Jumlah satelit kepiting
  • Jumlah penghargaan yang dimenangkan seseorang
  • Jumlah pesepeda melintas jembatan
Generalized Linear Models di Python

Peubah acak Poisson

  • Kejadian terjadi independen dan acak
  • Distribusi Poisson

$$ P(y)=\frac{\lambda^ye^{-\lambda}}{y!} $$

  • $\lambda$ : mean dan varians
  • $y=0,1,2,3, ...$
    • $\text{\color{#E80C7A}{Selalu positif}}$
    • Diskret (bukan kontinu)
    • $\text{\color{#E80C7A}{Batas bawah nol}}$, tanpa batas atas
Generalized Linear Models di Python

Memahami parameter distribusi Poisson

Plot distribusi peubah acak Poisson dengan lambda 1, 5, dan 10.

Generalized Linear Models di Python

Memvisualisasikan respons

import seaborn as sns
sns.distplot('y')
Generalized Linear Models di Python

Regresi Poisson

  • Variabel respons $$ y \sim Poisson(\lambda) $$

  • Rata-rata respons $$ E(y)=\lambda $$

  • Model regresi Poisson $$ log(\lambda)=\beta_0+\beta_1x_1 $$

Generalized Linear Models di Python

Variabel penjelas

  • Kontinu dan/atau kategorikal $\rightarrow$ model regresi Poisson
  • Kategorikal $\rightarrow$ model log-linear
Generalized Linear Models di Python

GLM dengan Poisson di Python

import statsmodels.api as sm
from statsmodels.formula.api import glm
glm('y ~ x', 
    data = my_data,
    family = sm.families.Poisson())
Generalized Linear Models di Python

Ayo berlatih!

Generalized Linear Models di Python

Preparing Video For Download...