AIC en BIC

ARIMA-modellen in Python

James Fulton

Climate informatics researcher

AIC - Akaike-informatiecriterium

  • Lagere AIC betekent een beter model
  • AIC kiest vaak eenvoudige modellen met lagere orde
ARIMA-modellen in Python

BIC - Bayesiaans informatiecriterium

  • Erg vergelijkbaar met AIC
  • Lagere BIC betekent een beter model
  • BIC kiest vaak eenvoudige modellen met lagere orde
ARIMA-modellen in Python

AIC vs BIC

  • BIC verkiest eenvoudigere modellen dan AIC
  • AIC is beter voor voorspellende modellen
  • BIC is beter voor verklarende modellen
ARIMA-modellen in Python

AIC en BIC in statsmodels

# Maak model
model = ARIMA(df, order=(1,0,1))

# Fit model results = model.fit()
# Print samenvatting print(results.summary())
                            Statespace Model Results                           
==============================================================================
Dep. Variable:                      y   No. Observations:                 1000
Model:               SARIMAX(2, 0, 0)   Log Likelihood               -1399.704
Date:                Fri, 10 May 2019   AIC                           2805.407
Time:                        01:06:11   BIC                           2820.131
Sample:                    01-01-2013   HQIC                          2811.003
                         - 09-27-2015                                         
Covariance Type:                  opg
ARIMA-modellen in Python

AIC en BIC in statsmodels

# Maak model
model = ARIMA(df, order=(1,0,1))

# Fit model results = model.fit()
# Print AIC en BIC print('AIC:', results.aic) print('BIC:', results.bic)
AIC: 2806.36 
BIC: 2821.09
ARIMA-modellen in Python

Zoeken op AIC en BIC

# Loop over AR-orde
for p in range(3):
    # Loop over MA-orde
    for q in range(3):

# Model fitten model = ARIMA(df, order=(p,0,q)) results = model.fit()
# print de modelorde en de AIC/BIC-waarden print(p, q, results.aic, results.bic)
0 0 2900.13 2905.04
0 1 2828.70 2838.52
0 2 2806.69 2821.42
1 0 2810.25 2820.06
1 1 2806.37 2821.09
1 2 2807.52 2827.15
...
ARIMA-modellen in Python

Zoeken op AIC en BIC

order_aic_bic =[]
# Loop over AR-orde
for p in range(3):
    # Loop over MA-orde
    for q in range(3):

# Model fitten model = ARIMA(df, order=(p,0,q)) results = model.fit()
# Voeg orde en scores toe aan lijst order_aic_bic.append((p, q, results.aic, results.bic))
# DataFrame met modelorde en AIC/BIC-scores
order_df = pd.DataFrame(order_aic_bic, columns=['p','q', 'aic', 'bic'])
ARIMA-modellen in Python

Zoeken op AIC en BIC

# Sorteren op AIC
print(order_df.sort_values('aic'))
   p  q      aic      bic
7  2  1  2804.54  2824.17
6  2  0  2805.41  2820.13
4  1  1  2806.37  2821.09
2  0  2  2806.69  2821.42
...
# Sorteren op BIC
print(order_df.sort_values('bic'))
   p  q      aic      bic
3  1  0  2810.25  2820.06
6  2  0  2805.41  2820.13
4  1  1  2806.37  2821.09
2  0  2  2806.69  2821.42
...
ARIMA-modellen in Python

Niet-stationaire modelordes

# Model fitten
model = ARIMA(df, order=(2,0,1))
results = model.fit()
ValueError: Non-stationary starting autoregressive parameters
found with `enforce_stationarity` set to True.
ARIMA-modellen in Python

Als bepaalde ordes niet werken

# Loop over AR-orde
for p in range(3):
    # Loop over MA-orde
    for q in range(3):

# Model fitten model = ARIMA(df, order=(p,0,q)) results = model.fit() # Print de modelorde en de AIC/BIC-waarden print(p, q, results.aic, results.bic)
ARIMA-modellen in Python

Als bepaalde ordes niet werken

# Loop over AR-orde
for p in range(3):
    # Loop over MA-orde
    for q in range(3):

try: # Model fitten model = ARIMA(df, order=(p,0,q)) results = model.fit() # Print de modelorde en de AIC/BIC-waarden print(p, q, results.aic, results.bic)
except: # Print AIC en BIC als None bij mislukken print(p, q, None, None)
ARIMA-modellen in Python

Laten we oefenen!

ARIMA-modellen in Python

Preparing Video For Download...