Rekayasa Fitur di R
Jorge Zazueta
Research Professor. Head of the Modeling Group at the School of Economics, UASLP
Model yang lebih lengkap mencakup banyak variabel.
lr_model <- logistic_reg()
lr_recipe <-
recipe(class~ sponsor_code +
contract_value_band +
category_code,
data = grants_train) %>%
step_lencode_glm(sponsor_code,
contract_value_band,
category_code,
outcome = vars(class))
Dengan hasil yang lebih menarik.
lr_aug %>% class_evaluate(truth = class,
estimate = .pred_class,
.pred_successful)
# A tibble: 2 × 3
.metric .estimator .estimate
<chr> <chr> <dbl>
1 accuracy binary 0.890
2 roc_auc binary 0.951
Kita dapat memplot fitur berdasarkan peringkat kepentingannya dengan bantuan paket vip().
lr_fit %>%
extract_fit_parsnip() %>%
vip(aesthetics =
list(fill = "steelblue"))
Bagan pentingnya variabel

Pentingnya variabel dapat menjadi umpan balik yang kuat untuk menyempurnakan rekayasa fitur berdasarkan pengetahuan domain.

Rekayasa Fitur di R