Modellen vergelijken

Generalized Linear Models in Python

Ita Cirovic Donev

Data Science Consultant

Deviantie

  • Formule $$ D = -2LL(\beta) $$

  • Foutmaat

  • Lagere deviantie $\rightarrow$ beter model
  • Referentie: nuldeviantie $\rightarrow$ alleen intercept
  • Beoordeel
    • Een willekeurige ruisvariabele verlaagt gemiddeld de deviantie met 1
    • Voeg je $p$ voorspellers toe, dan moet de deviantie met meer dan $p$ dalen
Generalized Linear Models in Python

Deviantie in Python

Samenvatting van het model 'y ~ distance100' met markering van de log-likelihood en de deviantiestatistiek.

Generalized Linear Models in Python

Deviantie berekenen

  • Haal nuldeviantie en deviantie op
    # Extract null deviance
    print(model.null_deviance)
    
4118.0992
# Extract model deviance
print(model.deviance)
4076.2378
  • Bereken deviantie via log-likelihood
    print(-2*model.llf)
    
4076.2378
  • Daling in deviantie: 41,86
  • distance100 verbeterde de fit
Generalized Linear Models in Python

Modelcomplexiteit

  • model_1 en model_2, waarbij
    • $L1 > L2$
    • Meer parameters in model_2
  • model_2 is overfitting
Generalized Linear Models in Python

Laten we oefenen!

Generalized Linear Models in Python

Preparing Video For Download...