Medyanla atama

R ile caret kullanarak Machine Learning

Max Kuhn

Software Engineer at RStudio and creator of caret

Eksik değerlerle başa çıkma

  • Çoğu model sayısal veri ister, eksikleri işleyemez
  • Yaygın yaklaşım: eksik verili satırları silmek
    • Veride yanlılığa yol açabilir
    • Aşırı güvenli modeller üretir
  • Daha iyi strateji: medyanla atama!
    • Eksikleri medyanlarla değiştirin
    • Veri rastgele eksikse (MAR) iyi çalışır
R ile caret kullanarak Machine Learning

Örnek: mtcars

# Eksik değerli veri üretelim
data(mtcars)
set.seed(42)
mtcars[sample(1:nrow(mtcars), 10), "hp"] <- NA
# Hedefi öngörücülerden ayırın
Y <- mtcars$mpg
X <- mtcars[, 2:4]
# Bir caret modeli kurmayı deneyin
library(caret)
model <- train(X, Y)
Error in train.default(X, Y) : Stopping 
R ile caret kullanarak Machine Learning

Basit bir çözüm

# Şimdi medyanla atama ile kurun
model <- train(X, Y, preProcess = "medianImpute")
print(model)
Random Forest 

32 samples
 3 predictor

Pre-processing: median imputation (3) 
Resampling: Bootstrapped (25 reps) 
Summary of sample sizes: 32, 32, 32, 32, 32, 32, ... 
Resampling results across tuning parameters:

  mtry  RMSE      Rsquared 
  2     2.617096  0.8234652
  3     2.670550  0.8164535

RMSE was used to select the optimal model using the smallest value.
The final value used for the model was mtry = 2. 
R ile caret kullanarak Machine Learning

Haydi pratik yapalım!

R ile caret kullanarak Machine Learning

Preparing Video For Download...