Seleksi berdasarkan korelasi dengan fitur lain

Reduksi Dimensi di R

Matt Pickard

Owner, Pickard Predictives, LLC

Tinjau pembuatan plot korelasi

healthcare_df %>% 
  select(where(is.numeric)) %>%

correlate() %>%
shave() %>%
rplot(print_cor = TRUE) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))
Reduksi Dimensi di R

Plot korelasi

plot korelasi attrition perusahaan layanan kesehatan

Reduksi Dimensi di R

Kekuatan korelasi

plot korelasi attrition perusahaan layanan kesehatan dengan tabel rentang kekuatan korelasi

Reduksi Dimensi di R

Filter korelasi?

plot korelasi attrition perusahaan layanan kesehatan

Reduksi Dimensi di R

Filter korelasi?

diagram Venn kenaikan gaji persen dan penilaian kinerja menunjukkan tumpang tindih besar informasi mutual

Reduksi Dimensi di R

Filter korelasi?

Diagram Venn kenaikan gaji persen dengan penilaian kinerja dihapus

Reduksi Dimensi di R

Filter korelasi?

Kedua bagian diagram Venn dihapus untuk menunjukkan kita menghapus informasi berharga

Reduksi Dimensi di R

Resep filter korelasi

# create and prep the recipe
corr_recipe <-  
  recipe(Attrition ~ ., data = healthcare_df) %>%

step_corr(all_numeric_predictors(), threshold = 0.7) %>%
prep()
# Apply the recipe to the data filtered_healthcare_df <- corr_recipe %>% bake(new_data = NULL)
# Identify the features that were removed tidy(corr_recipe, number = 1)
Reduksi Dimensi di R

Ayo berlatih!

Reduksi Dimensi di R

Preparing Video For Download...