Torbalanmış ağaçlar

R ile Ağaç Tabanlı Modellerle Machine Learning

Sandro Raabe

Data Scientist

Çok kafa, tek kafadan iyidir

kalabalığın bilgeliği

R ile Ağaç Tabanlı Modellerle Machine Learning

Bootstrap ve birleştirme

  • Bagging = Bootstrap Aggregation kısaltması

 

 1. Bootstrap

  • Yerine koyarak örnekleme $\rightarrow$ çok sayıda değiştirilmiş eğitim kümesi

 

 2. Birleştirme

  • Farklı modellerin tahminleri son tahmin için birleştirilir:
    • Regresyonda ortalama
    • Sınıflandırmada çoğunluk oyu
R ile Ağaç Tabanlı Modellerle Machine Learning

Adım 1: Bootstrap ve eğit

bootstrap şeması

R ile Ağaç Tabanlı Modellerle Machine Learning

Adım 2: Birleştir

sonuçları birleştir

R ile Ağaç Tabanlı Modellerle Machine Learning

Kodlama: Torbalanmış ağaçları belirtin

library(baguette)
spec_bagged <- bag_tree() %>%

set_mode("classification") %>%
set_engine("rpart", times = 100)
Torbalanmış Karar Ağacı Model Tanımı (sınıflandırma)

Ana Argümanlar:
  cost_complexity = 0
  min_n = 2

Motor-Özel Argümanlar:
  times = 100

Hesaplama motoru: rpart
R ile Ağaç Tabanlı Modellerle Machine Learning

Tüm ağaçları eğitme

model_bagged <- fit(spec_bagged, formula = still_customer ~ ., data = customers_train)
parsnip model nesnesi

Uygunlaştırma süresi:  23.9s

Torbalanmış CART (100 üyeli sınıflandırma)
Değişken önem puanları: # A tibble: 19 x 4 term value std.error used <chr> <dbl> <dbl> <int> 1 total_trans_ct 876. 3.93 100 2 total_trans_amt 800. 4.54 100 3 total_revolving_bal 491. 3.67 100
R ile Ağaç Tabanlı Modellerle Machine Learning

Haydi bootstrap yapalım!

R ile Ağaç Tabanlı Modellerle Machine Learning

Preparing Video For Download...