Selezione basata sulla correlazione con altre feature

Riduzione della dimensionalità in R

Matt Pickard

Owner, Pickard Predictives, LLC

Rivedi la creazione del grafico di correlazione

healthcare_df %>% 
  select(where(is.numeric)) %>%

correlate() %>%
shave() %>%
rplot(print_cor = TRUE) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))
Riduzione della dimensionalità in R

Grafico di correlazione

grafico di correlazione: abbandono in azienda sanitaria

Riduzione della dimensionalità in R

Intensità della correlazione

grafico di correlazione dell’abbandono con tabella delle soglie di intensità

Riduzione della dimensionalità in R

Un filtro di correlazione?

grafico di correlazione: abbandono in azienda sanitaria

Riduzione della dimensionalità in R

Un filtro di correlazione?

diagramma di Venn: aumento stipendio % e valutazione performance con forte sovrapposizione di info condivisa

Riduzione della dimensionalità in R

Un filtro di correlazione?

Diagramma di Venn: percentuale aumento stipendio con valutazione performance rimossa

Riduzione della dimensionalità in R

Un filtro di correlazione?

Entrambe le parti del diagramma di Venn rimosse: abbiamo tolto info utili

Riduzione della dimensionalità in R

Una ricetta con filtro di correlazione

# create and prep the recipe
corr_recipe <-  
  recipe(Attrition ~ ., data = healthcare_df) %>%

step_corr(all_numeric_predictors(), threshold = 0.7) %>%
prep()
# Apply the recipe to the data filtered_healthcare_df <- corr_recipe %>% bake(new_data = NULL)
# Identify the features that were removed tidy(corr_recipe, number = 1)
Riduzione della dimensionalità in R

Ayo berlatih!

Riduzione della dimensionalità in R

Preparing Video For Download...