Pembangunan dan Evaluasi Model dengan tidymodels

Reduksi Dimensi di R

Matt Pickard

Owner, Pickard Predictives, LLC

Proses pemasangan model

langkah pertama pemasangan model adalah membagi data

Reduksi Dimensi di R

Proses pemasangan model

langkah kedua pemasangan model adalah menyiapkan data

Reduksi Dimensi di R

Proses pemasangan model

langkah ketiga pemasangan model adalah memasang model

Reduksi Dimensi di R

Proses pemasangan model

langkah keempat pemasangan model adalah mengevaluasi model

Reduksi Dimensi di R

Pemasangan model dengan tidymodels

tidymodels memiliki fungsi untuk membagi data menjadi train dan test

Reduksi Dimensi di R

Pemasangan model dengan tidymodels

resep tidymodels memiliki fungsi untuk membuat langkah prapemrosesan data

Reduksi Dimensi di R

Pemasangan model dengan tidymodels

tidymodels memiliki fungsi untuk memasang berbagai model dalam workflow

Reduksi Dimensi di R

Membagi data train dan test

split <- initial_split(credit_df, prop = 0.8, strata = credit_score)


train <- split %>% training()
test <- split %>% testing()
Reduksi Dimensi di R

Membuat recipe dan model

feature_selection_recipe <- 
  recipe(credit_score ~ ., data = train) %>%

step_filter_missing(all_predictors(), threshold = 0.5) %>%
step_scale(all_numeric_predictors()) %>%
step_nzv(all_predictors()) %>%
prep()
lr_model <- logistic_reg() %>%

set_engine("glm")
Reduksi Dimensi di R

Buat dan pasang workflow

credit_wflow <- workflow() %>%

add_recipe(feature_selection_recipe) %>%
add_model(lr_model)
credit_fit <- credit_wflow %>% fit(data = train)
Reduksi Dimensi di R

Evaluasi model

# Predict test data
credit_pred_df <- predict(credit_fit, test) %>% 
  bind_cols(test %>% select(credit_score))


# Evaluate F score f_meas(credit_pred_df, credit_score, .pred_class)
# A tibble: 1 × 3
  .metric .estimator .estimate
  <chr>   <chr>          <dbl>
1 f_meas  macro          0.519
Reduksi Dimensi di R

Jelajahi recipe dengan tidy()

tidy(feature_selection_recipe, number = 1)
# A tibble: 2 × 2
  terms            id                  
  <chr>            <chr>               
1 age              filter_missing_gVVfc
2 outstanding_debt filter_missing_gVVfc
Reduksi Dimensi di R

Jelajahi model dengan tidy()

# Tampilkan estimasi model
tidy(credit_fit)
# A tibble: 44 × 5
   term                estimate std.error statistic p.value
   <chr>                  <dbl>     <dbl>     <dbl>   <dbl>
 1 (Intercept)           2.88       0.918    3.13   0.00173
 2 monthAugust          -0.449      0.236   -1.91   0.0565 
 3 monthFebruary        17.7      677.       0.0262 0.979  
 4 monthJanuary         17.7      661.       0.0268 0.979  
 ...                    ...       ...        ...    ... 
Reduksi Dimensi di R

Ayo berlatih!

Reduksi Dimensi di R

Preparing Video For Download...