Özellik seçimi vs. özellik çıkarımı

R'de Boyutsal Azaltma

Matt Pickard

Owner, Pickard Predictives, LLC

Boyut indirgeme yaklaşımları

Sebze bahçesi

  • Özellik seçimi, ot ayıklamaya benzer
  • Özellik çıkarımı, salata yapmaya benzer
1 Görsel kaynağı: Daderot, CC0, Wikimedia Commons üzerinden
R'de Boyutsal Azaltma

Özellik seçimi

Renk kodlu altı özellik seti

R'de Boyutsal Azaltma

Özellik seçimi

Düşük bilgi içeren özellikler filtrelenmiş altı özellik seti

R'de Boyutsal Azaltma

Özellik seçimi

Filtrelenmiş dört özellik seti

R'de Boyutsal Azaltma

Örnek kredi verisi

credit_df %>% head(n=5)
  annual_income num_bank_accounts num_credit_card outstanding_debt credit_history_months
          <dbl>             <dbl>           <dbl>            <dbl>                 <dbl>
1        87630.                 2               5             526.                   286
2        16574.                 2               5              NA                    122
3        24931.                 2               5              NA                    351
4       136680.                 2               5              NA                    216
5        76850.                 2               5            1112.                   272
R'de Boyutsal Azaltma

Sıfır varyans filtresi oluşturun

na_filter <- credit_df %>% 
  summarize(across(everything(), ~ var(., na.rm = TRUE))) %>%

pivot_longer(everything(), names_to = "feature", values_to = "variance") %>%
filter(variance == 0) %>%
pull(feature)
na_filter
"num_bank_accounts" "num_credit_card"
R'de Boyutsal Azaltma

Eksik değer filtresi oluşturun

na_filter <- credit_df %>%  
  summarize(across(everything(), ~ sum(is.na(.)))) %>%

pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>%
filter(num_missing_values > 0) %>%
pull(feature)
na_filter
"outstanding_debt"
R'de Boyutsal Azaltma

Birleşik filtreyi uygulama

combined_filter <- 
  c(low_var_filter, na_filter)

credit_df %>% 
  select(-all_of(combined_filter)) %>% 
  head(3)
  annual_income credit_history_months
          <dbl>                 <dbl>
1        87630.                   286
2        16574.                   122
3        24931.                   351
R'de Boyutsal Azaltma

Özellik çıkarımı

Renk kodlu altı özellik seti

R'de Boyutsal Azaltma

Özellik çıkarımı

Bazı özellikler birleştirilerek dört özellik elde edildi

R'de Boyutsal Azaltma

Özellik çıkarımı ve karşılıklı bilgi

Kesişimli Venn diyagramı

R'de Boyutsal Azaltma

Özellik çıkarımı: Birbirini dışlayan bilgiyi birleştirme

Karşılıklı ve birbirini dışlayan bilgiyi içeren birleşik özellikler

R'de Boyutsal Azaltma

Özellik çıkarımı: Birbirini dışlayan bilgiyi birleştirme

Karşılıklı bilgi çıkarılmış birleşik özellikler

R'de Boyutsal Azaltma

Özellik çıkarımının artı ve eksileri

Avantajlar
  • bilgiyi yeni özelliklerde birleştirebilir
Dezavantajlar
  • uygulaması daha karmaşıktır
  • yeni özellikler yorumlaması zordur

Beden kitle indeksi, boy ve kilonun temel bileşen analizi

R'de Boyutsal Azaltma

Haydi pratik yapalım!

R'de Boyutsal Azaltma

Preparing Video For Download...