Voorspellen met tijdreeksen

Data Science begrijpen

Lis Sulmont

Curriculum Manager

Modelleren in datawetenschap

Wat is een statistisch model?

  • Geef een echt proces weer met statistieken
  • Wiskundige relaties tussen variabelen, inclusief willekeurige variabelen
  • Gebaseerd op statistische aannames en historische gegevens
Data Science begrijpen

Voorspellende modellen

Voorspellend model

  • Voer nieuwe gegevens in en het model voorspelt een resultaat.
Data Science begrijpen

Voorspellende modellen

Voorspellend model

  • Voer nieuwe gegevens in en het model voorspelt een resultaat.
Data Science begrijpen

Voorspellende modellen

Voorspellend model

  • Voer nieuwe gegevens in en het model voorspelt een resultaat.
    • Kans dat iets gebeurt
Data Science begrijpen

Voorspellende modellen

Voorspellend model

  • Voer nieuwe gegevens in en het model voorspelt een resultaat.
    • Kans dat iets gebeurt
  • Verschilt in complexiteit, van een lineaire vergelijking tot een deep learning-algoritme.
Data Science begrijpen

Tijdreeksgegevens

Een reeks gegevenspunten die op tijd zijn gesorteerd

  • Aandelenkoersen
  • Benzineprijzen
  • Werkloosheidscijfers
  • Hartslag
  • CO2-niveaus
  • Hoe hoog zijn de getijden in de oceaan?

Tijdreeksicoontje

Data Science begrijpen

Tijdreeksgegevens in een grafiek zetten

Canadese werkloosheidscijfers

Datum Percentage
01-01-1976 7,1
01-02-1976 7
...
01-01-1991 10,3
...
01-04-2015 6,8
01-05-2015 6,8
Data Science begrijpen

Seizoensgebondenheid in tijdreeksen

Weertijdreeks

Data Science begrijpen

Seizoensgebondenheid in tijdreeksen

Weertijdreeks

Data Science begrijpen

Tijdreeksen voorspellen

  • Voorbeelden:
    • Hoeveel regen krijgen we volgende maand?
    • Wordt het verkeer het komende half uur wat rustiger?
    • Hoe gaat de aandelenmarkt de komende zes uur bewegen?
    • Hoeveel mensen zullen er over 20 jaar op aarde zijn?
  • Maak een model op basis van oude gegevens om voorspellingen te doen.
  • Modelleringsmethoden gebruiken een mix van statistische en machine learning-methoden.
Data Science begrijpen

Prijs van erwten in Rwanda

Data Science begrijpen

Voorspelde erwtenprijzen

$$

Betrouwbaarheidsintervallen

Het model is er X% zeker van dat de echte waarde in dit gebied zal liggen.

Data Science begrijpen

Laten we oefenen!

Data Science begrijpen

Preparing Video For Download...