R'da Feature Engineering
Jorge Zazueta
Research Professor. Head of the Modeling Group at the School of Economics, UASLP
Daha kapsamlı bir model çok sayıda değişken içerir.
lr_model <- logistic_reg()
lr_recipe <-
recipe(class~ sponsor_code +
contract_value_band +
category_code,
data = grants_train) %>%
step_lencode_glm(sponsor_code,
contract_value_band,
category_code,
outcome = vars(class))
Daha cazip sonuçlar verir.
lr_aug %>% class_evaluate(truth = class,
estimate = .pred_class,
.pred_successful)
# A tibble: 2 × 3
.metric .estimator .estimate
<chr> <chr> <dbl>
1 accuracy binary 0.890
2 roc_auc binary 0.951
Önem sırasına göre özellikleri vip() paketiyle görselleştirebiliriz.
lr_fit %>%
extract_fit_parsnip() %>%
vip(aesthetics =
list(fill = "steelblue"))
Değişken önem grafiği

Değişken önemi, alan bilgisini baz alan özellik mühendisliğini iyileştirmek için güçlü bir geri bildirim mekanizmasıdır.

R'da Feature Engineering