Welkom bij de cursus

Machine Learning met caret in R

Max Kuhn

Software Engineer at RStudio and creator of caret

Supervised learning

  • R-pakket caret
  • Automatiseert supervised learning (predictive modeling)
  • Doelvariabele

Een afbeelding van een bloem en een factuur met het label "past due".

Machine Learning met caret in R

Supervised learning

  • Twee typen voorspellende modellen
    • Classificatie ⇒ Kwalitatief
    • Regressie ⇒ Kwantitatief
  • Gebruik metrics om modellen te evalueren
    • Kwantificeerbaar
    • Objectief
  • Root Mean Squared Error (RMSE) voor regressie
Machine Learning met caret in R

Modelprestatie evalueren

  • In-sample RMSE berekenen is gebruikelijk
    • Te optimistisch
    • Leidt tot overfitting
  • Beter: out-of-sample fout (zoals in caret)
    • Simuleert gebruik in de praktijk
    • Helpt overfitting te voorkomen
Machine Learning met caret in R

In-sample fout

# Fit a model to the mtcars data
data(mtcars)
model <- lm(mpg ~ hp, mtcars[1:20, ])
# Predict in-sample
predicted <- predict(
  model, mtcars[1:20, ], type = "response"
)
# Calculate RMSE
actual <- mtcars[1:20, "mpg"]
sqrt(mean((predicted - actual) ^ 2))
3.172132
Machine Learning met caret in R

Laten we oefenen!

Machine Learning met caret in R

Preparing Video For Download...