Trainings- en testsets

Voorspellen in R

Rob J. Hyndman

Professor of Statistics at Monash University

Trainings- en testsets

ch2_vid3_slides.003.png

Voorspellen in R

Trainings- en testsets

ch2_vid3_slides.004.png

Voorspellen in R

Trainings- en testsets

ch2_vid3_slides.005.png

  • De testset mag niet gebruikt worden voor het berekenen van forecasts
  • Bouw forecasts met de trainingsset
  • Een model dat de trainingsdata goed past, forecast niet per se goed
Voorspellen in R

Voorbeeld: Saoedische olieproductie

training <- window(oil, end = 2003)
test <- window(oil, start = 2004)
fc <- naive(training, h = 10)
autoplot(fc) + autolayer(test, series = "Test data")

ch2_vid3_saudi_oil_forecast.png

Voorspellen in R

Forecastfouten

Forecast“fout” = verschil tussen geobserveerde waarde en de forecast in de testset.
≠ residuen
  • dat zijn fouten op de trainingsset (vs. testset)
  • gebaseerd op one-step forecasts (vs. multi-step)

Bereken nauwkeurigheid met forecastfouten op testdata

Voorspellen in R

Maten voor forecastnauwkeurigheid

  • Observatie: $y_t$
  • Forecast: $\hat{y}_t$
  • Forecastfout: $e_t = y_t - \hat{y}_t$
Nauwkeurigheidsmaat Berekening
Gemiddelde absolute fout $\text{MAE} = avg(\mid e_t \mid)$
Gemiddelde kwadratische fout $\text{MSE} = avg(e_t^2)$
Gemiddelde absolute percentagefout $\text{MAPE} = 100 \times avg(\mid \frac{e_t}{y_t} \mid )$
Gemiddelde absolute geschaalde fout $\text{MASE} = \frac{\text{MAE}}{Q}$ waarbij $Q$ een schaalconstante is
Voorspellen in R

Het commando accuracy()

accuracy(fc, test)
                  ME   RMSE    MAE    MPE    MAPE    MASE    ACF1  Theil's U
Training set   9.874  52.56  39.43  2.507  12.571  1.0000  0.1802         NA
Test set      21.602  35.10  29.98  3.964   5.778  0.7603  0.4030      1.185
Voorspellen in R

Laten we oefenen!

Voorspellen in R

Preparing Video For Download...