Machine learning-workflow

Inzicht in Machine Learning

Lis Sulmont

Curriculum Manager, DataCamp

Machine learning-workflow

Inzicht in Machine Learning

Onze casus

New York City

Onze dataset: Vastgoedverkopen in NYC van 2015–2019

Bevat:

  • Vierkante meters
  • Buurt
  • Bouwjaar
  • Verkoopprijs
  • En meer!

Ons doel: Verkoopprijs

Inzicht in Machine Learning

Stap 1: Features extraheren

Inzicht in Machine Learning

Stap 2: Dataset splitsen

Inzicht in Machine Learning

Stap 3: Model trainen

Inzicht in Machine Learning

Stap 3: Model trainen

$$

Inzicht in Machine Learning

Stap 4: Evalueren

Inzicht in Machine Learning

Stap 4: Evalueren

Evaluatiestap

  • Testdataset: “onbekende” data
  • Veel manieren om te evalueren:
    • Wat is de gemiddelde fout van de voorspellingen?
    • Welk percentage appartementen is correct voorspeld binnen 10% marge?
Inzicht in Machine Learning

Stap 4: Evalueren

Inzicht in Machine Learning

Stap 4: Evalueren

Inzicht in Machine Learning

Stap 4: Evalueren

  • Zo niet, tune het model en train opnieuw:
    • bijv. modelopties wijzigen, features toevoegen/verwijderen
Inzicht in Machine Learning

Machine learning-workflow

Inzicht in Machine Learning

Samenvatting van de stappen

  1. Features extraheren
    • Features kiezen en de dataset bewerken
  2. Dataset splitsen
    • Train- en testdataset
  3. Model trainen
    • Traindataset in een machinelearningmodel voeren
  4. Evalueren
    • Als de gewenste prestatie niet wordt gehaald: model tunen en stap 3 herhalen
Inzicht in Machine Learning

Laten we oefenen!

Inzicht in Machine Learning

Preparing Video For Download...