Membandingkan model

Generalized Linear Models di Python

Ita Cirovic Donev

Data Science Consultant

Deviasi

  • Rumus $$ D = -2LL(\beta) $$

  • Ukuran galat

  • Deviasi lebih rendah $\rightarrow$ kecocokan model lebih baik
  • Tolok ukur: null deviance $\rightarrow$ model hanya intersep
  • Evaluasi
    • Menambah variabel noise acak rata-rata menurunkan deviasi sebesar 1
    • Menambah $p$ prediktor seharusnya menurunkan deviasi lebih dari $p$
Generalized Linear Models di Python

Deviasi di Python

Ringkasan output model 'y ~ distance100' dengan sorotan pada log-likelihood dan statistik deviasi.

Generalized Linear Models di Python

Hitung deviasi

  • Ekstrak null deviance dan deviance
    # Extract null deviance
    print(model.null_deviance)
    
4118.0992
# Extract model deviance
print(model.deviance)
4076.2378
  • Hitung deviasi dari log-likelihood
    print(-2*model.llf)
    
4076.2378
  • Penurunan deviasi sebesar 41,86
  • Menyertakan distance100 memperbaiki kecocokan
Generalized Linear Models di Python

Kompleksitas model

  • model_1 dan model_2, dengan
    • $L1 > L2$
    • Jumlah parameter lebih banyak pada model_2
  • model_2 mengalami overfitting
Generalized Linear Models di Python

Ayo berlatih!

Generalized Linear Models di Python

Preparing Video For Download...