Pohon bagging

Machine Learning dengan Model Berbasis Pohon di R

Sandro Raabe

Data Scientist

Banyak kepala lebih baik daripada satu

kebijaksanaan kerumunan

Machine Learning dengan Model Berbasis Pohon di R

Bootstrap & agregasi

  • Bagging = singkatan dari Bootstrap Aggregation

 

 1. Bootstrapping

  • Sampling dengan pengembalian $\rightarrow$ banyak set latih termodifikasi

 

 2. Agregasi

  • Prediksi dari model berbeda digabungkan untuk prediksi akhir:
    • Rata-rata (pada regresi)
    • Suara mayoritas (pada klasifikasi)
Machine Learning dengan Model Berbasis Pohon di R

Langkah 1: Bootstrap dan latih

skema bootstrapping

Machine Learning dengan Model Berbasis Pohon di R

Langkah 2: Agregasi

agregasikan hasil

Machine Learning dengan Model Berbasis Pohon di R

Ngoding: Spesifikasikan pohon bagging

library(baguette)
spec_bagged <- bag_tree() %>%

set_mode("classification") %>%
set_engine("rpart", times = 100)
Spesifikasi Model Decision Tree Bagging (klasifikasi)

Argumen Utama:
  cost_complexity = 0
  min_n = 2

Argumen Khusus Engine:
  times = 100

Mesin komputasi: rpart
Machine Learning dengan Model Berbasis Pohon di R

Latih semua pohon

model_bagged <- fit(spec_bagged, formula = still_customer ~ ., data = customers_train)
parsnip model object

Fit time:  23.9s

Bagged CART (klasifikasi dengan 100 anggota)
Skor pentingnya variabel mencakup: # A tibble: 19 x 4 term value std.error used <chr> <dbl> <dbl> <int> 1 total_trans_ct 876. 3.93 100 2 total_trans_amt 800. 4.54 100 3 total_revolving_bal 491. 3.67 100
Machine Learning dengan Model Berbasis Pohon di R

Ayo bootstrap!

Machine Learning dengan Model Berbasis Pohon di R

Preparing Video For Download...