Pentingnya Variabel

Rekayasa Fitur di R

Jorge Zazueta

Research Professor. Head of the Modeling Group at the School of Economics, UASLP

Menambahkan lebih banyak prediktor

Model yang lebih lengkap mencakup banyak variabel.

lr_model <- logistic_reg()
lr_recipe <- 
  recipe(class~ sponsor_code +
         contract_value_band +
         category_code, 
         data = grants_train) %>%
  step_lencode_glm(sponsor_code,
                   contract_value_band,
                   category_code, 
                   outcome = vars(class))

Dengan hasil yang lebih menarik.

lr_aug %>% class_evaluate(truth = class,
               estimate = .pred_class,
               .pred_successful)
# A tibble: 2 × 3
  .metric  .estimator .estimate
  <chr>    <chr>          <dbl>
1 accuracy binary         0.890
2 roc_auc  binary         0.951
Rekayasa Fitur di R

Variabel mana yang paling berpengaruh?

Kita dapat memplot fitur berdasarkan peringkat kepentingannya dengan bantuan paket vip().

lr_fit %>%
  extract_fit_parsnip() %>%
  vip(aesthetics = 
      list(fill = "steelblue"))

Bagan pentingnya variabel

Bagan batang pentingnya variabel.

Rekayasa Fitur di R

Pentingnya variabel dan rekayasa fitur

Pentingnya variabel dapat menjadi umpan balik yang kuat untuk menyempurnakan rekayasa fitur berdasarkan pengetahuan domain.

Alur kerja pentingnya variabel dan rekayasa fitur.

Rekayasa Fitur di R

Ayo berlatih!

Rekayasa Fitur di R

Preparing Video For Download...