Confrontare i modelli

Modelli lineari generalizzati in Python

Ita Cirovic Donev

Data Science Consultant

Devianza

  • Formula $$ D = -2LL(\beta) $$

  • Misura dell'errore

  • Devianza minore $\rightarrow$ modello migliore
  • Riferimento: devianza nulla $\rightarrow$ modello solo intercetta
  • Valuta
    • Aggiungere una variabile di rumore riduce in media la devianza di 1
    • Aggiungere $p$ predittori dovrebbe ridurre la devianza di oltre $p$
Modelli lineari generalizzati in Python

Devianza in Python

Output di sintesi del modello 'y ~ distance100' con evidenza su log-likelihood e statistica di devianza.

Modelli lineari generalizzati in Python

Calcolare la devianza

  • Estrai devianza nulla e devianza
    # Extract null deviance
    print(model.null_deviance)
    
4118.0992
# Extract model deviance
print(model.deviance)
4076.2378
  • Calcola la devianza dalla log-likelihood
    print(-2*model.llf)
    
4076.2378
  • Riduzione della devianza di 41,86
  • Includere distance100 ha migliorato l'adattamento
Modelli lineari generalizzati in Python

Complessità del modello

  • model_1 e model_2, dove
    • $L1 > L2$
    • Numero di parametri più alto in model_2
  • model_2 è in overfitting
Modelli lineari generalizzati in Python

Passiamo alla pratica!

Modelli lineari generalizzati in Python

Preparing Video For Download...