Rastgele orman

R ile Ağaç Tabanlı Modellerle Machine Learning

Sandro Raabe

Data Scientist

Rastgele orman

  • Yüksek boyutlu veriler için uygun
  • Kullanımı kolay
  • Kutudan çıkar çıkmaz iyi performans
  • Çeşitli paketlerde uygulanmış: ranger, randomForest
  • Bu paketler için tidymodels arayüzü: rand_forest() (parsnip paketi içinde)
R ile Ağaç Tabanlı Modellerle Machine Learning

Fikir

  • Temel fikir (bagging ile aynı): bootstrap örnekleri üzerinde ağaçları eğitmek
  • Temel fark: ağaçlar arasında rastgele öznitelikler → rastgele orman
R ile Ağaç Tabanlı Modellerle Machine Learning

Sezgi

rastgele orman eskizi

R ile Ağaç Tabanlı Modellerle Machine Learning

Kodlama: Rastgele orman modeli belirtme

  • Fonksiyon adı: rand_forest()

Hiperparametreler:

  • mtry: her düğümde görülen öznitelik sayısı, varsayılan:
    $$\left\lfloor\sqrt\text{değişken sayısı}\right\rfloor$$
  • trees: ormandaki ağaç sayısı
  • min_n: izin verilen en küçük yaprak boyutu
rand_forest(

mtry = 4,
trees = 500,
min_n = 10) %>%
# Set the mode set_mode("classification") %>%
# Use engine ranger or randomForest set_engine("ranger")
R ile Ağaç Tabanlı Modellerle Machine Learning

Kodlama: Rastgele orman modeli belirtme

spec <- rand_forest(trees = 100) %>%

set_mode("classification") %>%
set_engine("ranger")
Rastgele Orman Model Özelliği

(sınıflandırma)
Temel Argümanlar: trees = 100
Hesaplama motoru: ranger
R ile Ağaç Tabanlı Modellerle Machine Learning

Bir ormanı eğitme

spec %>% fit(still_customer ~ ., data = customers_train)
parsnip model nesnesi

Eğitim süresi: 631 ms 
Ranger sonucu

Ağaç sayısı:                      100 
Örneklem boyutu:                  9116 
Bağımsız değişken sayısı:         19 
Mtry:                             4 
Hedef yaprak boyutu:              10
R ile Ağaç Tabanlı Modellerle Machine Learning

Değişken önemi

rand_forest(mode = "classification") %>%
    set_engine("ranger", importance = "impurity") %>%

fit(still_customer ~ ., data = customers_train) %>%
vip::vip()

vip grafiği

R ile Ağaç Tabanlı Modellerle Machine Learning

Haydi bir rastgele orman dikelim!

R ile Ağaç Tabanlı Modellerle Machine Learning

Preparing Video For Download...