Birden çok ön işleme yöntemi

R ile caret kullanarak Machine Learning

Zach Mayer

Data Scientist at DataRobot and co-author of caret

preProcess dünyası

  • Medyan veya knn imputasyonundan çok daha fazlası var!
  • Birden çok ön işleme adımı zincirlenebilir
  • Doğrusal modeller için yaygın “tarif” (sıra önemlidir!)
    • Medyan imputasyonu ⇒ merkezleme ⇒ ölçekleme ⇒ glm eğitimi
  • Daha fazla bilgi için ?preProcess
R ile caret kullanarak Machine Learning

Örnek: mtcars ön işleme

# Eksik değerli veri üret
data(mtcars)
set.seed(42)
mtcars[sample(1:nrow(mtcars), 10), "hp"] <- NA
Y <- mtcars$mpg
X <- mtcars[,2:4] # <- Rasgele eksik
# Doğrusal model “tarifi”ni kullan
set.seed(42)
model <- train(
  X, Y, method = "glm",
  preProcess = c("center", "scale", "medianImpute")
)
print(min(model$results$RMSE))
3.612713
R ile caret kullanarak Machine Learning

Örnek: mtcars ön işleme

# Modellemeden önce PCA
set.seed(42)
model <- train(
  X, Y, method = "glm",
  preProcess = c("center", "scale", "medianImpute", "pca")
)
min(model$results$RMSE)
3.402557
R ile caret kullanarak Machine Learning

Örnek: mtcars ön işleme

# Uzaysal işaret dönüşümü
set.seed(42)
model <- train(
  X, Y, method = "glm",
  preProcess = c("center", "scale", "medianImpute", "spatialSign")
)
min(model$results$RMSE)
4.284904
R ile caret kullanarak Machine Learning

Ön işleme kısa rehberi

  • Medyan imputasyonuyla başlayın
  • Veri rastgele eksik değilse KNN imputasyonu deneyin
  • Doğrusal modeller için...
    • Merkezleyin ve ölçekleyin
    • PCA ve uzaysal işareti deneyin
  • Ağaç tabanlı modeller çok az ön işleme ister
R ile caret kullanarak Machine Learning

Hadi pratik yapalım!

R ile caret kullanarak Machine Learning

Preparing Video For Download...