glmnet’e giriş

R ile caret kullanarak Machine Learning

Zach Mayer

Data Scientist at DataRobot and co-author of caret

glmnet’e giriş

  • Değişken seçimi yerleşik glm genişletmesi
  • Eşdoğrusallık ve küçük örneklemlerle başa çıkar
  • İki ana biçim
    • Lasso regresyonu: sıfır olmayan katsayı sayısını cezalandırır
    • Ridge regresyonu: katsayıların mutlak büyüklüğünü cezalandırır
  • Sade (yani basit) bir model bulmayı hedefler
  • Rastgele ormanlarla iyi çalışır
R ile caret kullanarak Machine Learning

glmnet modellerini ayarlama

  • Lasso ve ridge’in birleşimi
  • İki modelin karışımını kurabilir
  • alpha [0, 1]: saf ridge’den saf lasso’ya
  • lambda (0, infinity): ceza boyutu
R ile caret kullanarak Machine Learning

Örnek: "aşırı uyum yapmayın"

# Load data
overfit <- read.csv("overfit.csv")

# Make a custom trainControl
myControl <- trainControl(
  method = "cv", 
  number = 10,
  summaryFunction = twoClassSummary,
  classProbs = TRUE, # <- Super important!
  verboseIter = TRUE
)
R ile caret kullanarak Machine Learning

Varsayılanları deneyin

# Fit a model
set.seed(42)
model <- train(
  y ~ ., 
  overfit, 
  method = "glmnet", 
  trControl = myControl
)

# Plot results
plot(model)
  • 3 alpha değeri
  • 3 lambda değeri
R ile caret kullanarak Machine Learning

Sonuçları görselleştirin

Üç düzenlileştirme parametresi için karışım yüzdesine göre çapraz doğrulanmış ROC eğrilerinin çizgi grafiği. Orta düzenlileştirme değerinde 0,55’te bir tepe var.

R ile caret kullanarak Machine Learning

Hadi pratik yapalım!

R ile caret kullanarak Machine Learning

Preparing Video For Download...