tidymodels ile Model Kurma ve Değerlendirme

R'de Boyutsal Azaltma

Matt Pickard

Owner, Pickard Predictives, LLC

Model kurma süreci

model kurmanın ilk adımı veriyi ayırmaktır

R'de Boyutsal Azaltma

Model kurma süreci

model kurmanın ikinci adımı veriyi hazırlamaktır

R'de Boyutsal Azaltma

Model kurma süreci

model kurmanın üçüncü adımı modeli eğitmektir

R'de Boyutsal Azaltma

Model kurma süreci

model kurmanın dördüncü adımı modeli değerlendirmektir

R'de Boyutsal Azaltma

tidymodels ile model kurma

tidymodels, veriyi eğitim ve test setlerine ayırmak için işlevler içerir

R'de Boyutsal Azaltma

tidymodels ile model kurma

tidymodels tarifleri, veriyi ön işlemek için adım işlevleri sunar

R'de Boyutsal Azaltma

tidymodels ile model kurma

tidymodels, iş akışında çeşitli modelleri eğitmek için işlevler sağlar

R'de Boyutsal Azaltma

Eğitim ve test setlerine ayırma

split <- initial_split(credit_df, prop = 0.8, strata = credit_score)


train <- split %>% training()
test <- split %>% testing()
R'de Boyutsal Azaltma

Bir recipe ve model oluşturma

feature_selection_recipe <- 
  recipe(credit_score ~ ., data = train) %>%

step_filter_missing(all_predictors(), threshold = 0.5) %>%
step_scale(all_numeric_predictors()) %>%
step_nzv(all_predictors()) %>%
prep()
lr_model <- logistic_reg() %>%

set_engine("glm")
R'de Boyutsal Azaltma

İş akışını oluşturma ve eğitme

credit_wflow <- workflow() %>%

add_recipe(feature_selection_recipe) %>%
add_model(lr_model)
credit_fit <- credit_wflow %>% fit(data = train)
R'de Boyutsal Azaltma

Modeli değerlendirme

# Predict test data
credit_pred_df <- predict(credit_fit, test) %>% 
  bind_cols(test %>% select(credit_score))


# Evaluate F score f_meas(credit_pred_df, credit_score, .pred_class)
# A tibble: 1 × 3
  .metric .estimator .estimate
  <chr>   <chr>          <dbl>
1 f_meas  macro          0.519
R'de Boyutsal Azaltma

tidy() ile recipe’i inceleme

tidy(feature_selection_recipe, number = 1)
# A tibble: 2 × 2
  terms            id                  
  <chr>            <chr>               
1 age              filter_missing_gVVfc
2 outstanding_debt filter_missing_gVVfc
R'de Boyutsal Azaltma

tidy() ile modeli inceleme

# Display model estimates
tidy(credit_fit)
# A tibble: 44 × 5
   term                estimate std.error statistic p.value
   <chr>                  <dbl>     <dbl>     <dbl>   <dbl>
 1 (Intercept)           2.88       0.918    3.13   0.00173
 2 monthAugust          -0.449      0.236   -1.91   0.0565 
 3 monthFebruary        17.7      677.       0.0262 0.979  
 4 monthJanuary         17.7      661.       0.0268 0.979  
 ...                    ...       ...        ...    ... 
R'de Boyutsal Azaltma

Hadi pratik yapalım!

R'de Boyutsal Azaltma

Preparing Video For Download...