Predictive analytics

Introductie tot data-geletterdheid

Carl Rosseel

Head of Business Intelligence Curriculum, DataCamp

Overzicht analytics

Overzicht analytics

Introductie tot data-geletterdheid

Waarom predictive analytics?

  • Anticipeer op meest waarschijnlijke uitkomsten
  • Voorspel een proces of reeks
  • Schat een onbekende op basis van beschikbare info

 

Let op: voorspellingen hebben altijd onzekerheid

Close-up van predictive analytics

Introductie tot data-geletterdheid

Veelgebruikte technieken

  • Machinelearningmodellen
    • Classificatiegebaseerd
      • Opzeggingen van abonnementen voorspellen
    • Regressiegebaseerd
      • Woningprijzen voorspellen obv buurtkenmerken
  • Tijdreeksvoorspelling
    • Omzet door de tijd voorspellen
  • Voorspellende tekstanalyse
    • Voorspellen of een e-mail spam is of niet

Voorbeeld tijdreeks

Introductie tot data-geletterdheid

Voorspellend modelleren

Stappen van voorspellend modelleren

  • Data wordt gesplitst in train- en testset om het model te bouwen
  • Voorspellingen worden geïnterpreteerd en geëvalueerd op de testdata met vooraf gekozen metrics, zoals accuracy (percentage juiste voorspellingen)
Introductie tot data-geletterdheid

Casus: WK-winnaar

Welk team wint het meest waarschijnlijk het volgende WK?

  • Kies relevante variabelen zoals teamratings, spelersratings, ranglijsten en wedstrijdfactoren
  • Bouw een voorspelmodel om kans op winst of behalen van fases te schatten

 

Gebruik inzichten om de winstkans per land te voorspellen

WK-beker en bal

Introductie tot data-geletterdheid

Laten we oefenen!

Introductie tot data-geletterdheid

Preparing Video For Download...