Selecteren op correlatie met andere features

Dimensionality Reduction in R

Matt Pickard

Owner, Pickard Predictives, LLC

Correlatieplot maken: herhaling

healthcare_df %>% 
  select(where(is.numeric)) %>%

correlate() %>%
shave() %>%
rplot(print_cor = TRUE) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))
Dimensionality Reduction in R

Correlatieplot

correlatieplot van personeelsverloop bij het zorgbedrijf

Dimensionality Reduction in R

Sterkte van correlatie

correlatieplot van personeelsverloop bij het zorgbedrijf met tabel met correlatiesterktes

Dimensionality Reduction in R

Een correlatiefilter?

correlatieplot van personeelsverloop bij het zorgbedrijf

Dimensionality Reduction in R

Een correlatiefilter?

Venn-diagram van procentuele salarisverhoging en prestatiebeoordeling met grote overlap van wederzijdse informatie

Dimensionality Reduction in R

Een correlatiefilter?

Venn-diagram van procentuele salarisverhoging met prestatiebeoordeling verwijderd

Dimensionality Reduction in R

Een correlatiefilter?

Beide delen van het Venn-diagram verwijderd: we hebben waardevolle info weggehaald

Dimensionality Reduction in R

Een correlatiefilterrecept

# maak en bereid het recept voor
corr_recipe <-  
  recipe(Attrition ~ ., data = healthcare_df) %>%

step_corr(all_numeric_predictors(), threshold = 0.7) %>%
prep()
# Pas het recept toe op de data filtered_healthcare_df <- corr_recipe %>% bake(new_data = NULL)
# Bepaal welke features zijn verwijderd tidy(corr_recipe, number = 1)
Dimensionality Reduction in R

Laten we oefenen!

Dimensionality Reduction in R

Preparing Video For Download...