Değişken Önemi

R'da Feature Engineering

Jorge Zazueta

Research Professor. Head of the Modeling Group at the School of Economics, UASLP

Daha fazla yordayıcı ekleme

Daha kapsamlı bir model çok sayıda değişken içerir.

lr_model <- logistic_reg()
lr_recipe <- 
  recipe(class~ sponsor_code +
         contract_value_band +
         category_code, 
         data = grants_train) %>%
  step_lencode_glm(sponsor_code,
                   contract_value_band,
                   category_code, 
                   outcome = vars(class))

Daha cazip sonuçlar verir.

lr_aug %>% class_evaluate(truth = class,
               estimate = .pred_class,
               .pred_successful)
# A tibble: 2 × 3
  .metric  .estimator .estimate
  <chr>    <chr>          <dbl>
1 accuracy binary         0.890
2 roc_auc  binary         0.951
R'da Feature Engineering

Hangi değişkenler daha önemli?

Önem sırasına göre özellikleri vip() paketiyle görselleştirebiliriz.

lr_fit %>%
  extract_fit_parsnip() %>%
  vip(aesthetics = 
      list(fill = "steelblue"))

Değişken önem grafiği

Değişken önem çubuk grafiği.

R'da Feature Engineering

Değişken önemi ve özellik mühendisliği

Değişken önemi, alan bilgisini baz alan özellik mühendisliğini iyileştirmek için güçlü bir geri bildirim mekanizmasıdır.

Değişken önemi ve özellik mühendisliği iş akışı.

R'da Feature Engineering

Hadi pratik yapalım!

R'da Feature Engineering

Preparing Video For Download...