Verken een groter modelruimte

Machine Learning met caret in R

Zach Mayer

Data Scientist at DataRobot and co-author of caret

Random forests vereisen tuning

  • Hyperparameters bepalen hoe het model wordt getraind
  • Van tevoren handmatig gekozen
  • Belangrijkste is mtry
    • Aantal willekeurig gekozen variabelen per split
  • Lagere waarde = meer willekeurig
  • Hogere waarde = minder willekeurig
  • Moeilijk om vooraf de beste waarde te kennen
Machine Learning met caret in R

Voorbeeld: sonar-data

  • tuneLength-argument voor caret::train()
  • Zegt caret hoeveel varianten te proberen
# Data laden
library(caret)
library(mlbench)
data(Sonar)
# Model fitten met een groter tuningraster
model <- train(
  Class ~ ., 
  data = Sonar, 
  method = "ranger", 
  tuneLength = 10
)
# Resultaten plotten
plot(model)
Machine Learning met caret in R

Plot de resultaten

De afbeelding toont een lijngrafiek van bootstrapnauwkeurigheid versus het aantal willekeurig gekozen parameters. De lijn piekt rond x = 14 en daalt daarna snel.

Machine Learning met caret in R

Laten we oefenen!

Machine Learning met caret in R

Preparing Video For Download...