Random forests en wijn

Machine Learning met caret in R

Max Kuhn

Software Engineer at RStudio and creator of caret

Random forests

  • Populair type machine‑learningmodel
  • Fijn voor beginners
  • Robuust tegen overfitting
  • Levert zeer nauwkeurige, niet‑lineaire modellen
Machine Learning met caret in R

Random forests

  • In tegenstelling tot lineaire modellen hebben ze hyperparameters
  • Hyperparameters vereisen handmatige specificatie
  • Beïnvloeden de fit en verschillen per dataset
  • Standaardwaarden vaak prima, soms bijstellen
Machine Learning met caret in R

Random forests

  • Begin met een simpele beslisboom
  • Bomen zijn snel maar niet erg nauwkeurig

Machine Learning met caret in R

Random forests

  • Verhoog nauwkeurigheid door veel bomen te fitten
  • Fit elke op een bootstrap‑steekproef van je data
  • Dit heet bootstrap aggregation of bagging
  • Sample willekeurig kolommen bij elke split
Machine Learning met caret in R

Een random forest draaien

# Load some data
library(caret)
library(mlbench)
data(Sonar)

# Set seed
set.seed(42)
model <- train(
  Class ~ ., 
  data = Sonar, 
  method = "ranger"
)

pasted-image-1530.png

Machine Learning met caret in R

Resultaten plotten

# Plot the results
plot(model)

Machine Learning met caret in R

Laten we oefenen!

Machine Learning met caret in R

Preparing Video For Download...