Kursa hoş geldiniz!

R ile Ağaç Tabanlı Modellerle Machine Learning

Sandro Raabe

Data Scientist

Kurs genel bakış

 

  • Bölüm 1: Sınıflandırma ağaçları
  • Bölüm 2: Regresyon ağaçları, çapraz doğrulama, yanlılık-varyans dengesi
  • Bölüm 3: Hiperparametre ayarı, bagging, rastgele ormanlar
  • Bölüm 4: Artırılmış ağaçlar
R ile Ağaç Tabanlı Modellerle Machine Learning

Karar ağaçları akış şemalarıdır

hayvan_akış_şeması

1 https://aca.edu.au/resources/decision-trees-classifying-animals/decision-trees.pdf
R ile Ağaç Tabanlı Modellerle Machine Learning

Ağaç tabanlı modellerin avantajları

  • Açıklaması ve anlaşılması kolay
  • Doğrusal olmayan ilişkileri yakalayabilir
  • Sayısal özellikler için normalleştirme/standartlaştırma gerekmez
  • Sahte gösterge değişkenleri oluşturmaya gerek yok
  • Aykırı değerlere dayanıklıdır
  • Büyük veri kümelerinde hızlıdır
R ile Ağaç Tabanlı Modellerle Machine Learning

Ağaç tabanlı modellerin dezavantajları

  • Büyük, derin veya topluluk halinde ise yorumlaması zor
  • Yüksek varyans; karmaşık ağaçlar aşırı uyuma eğilimlidir
R ile Ağaç Tabanlı Modellerle Machine Learning

tidymodels_ekran_görüntüsü

R ile Ağaç Tabanlı Modellerle Machine Learning

tidymodels paketi

library(tidymodels)
-- Paketler yükleniyor -------------------- tidymodels 0.1.4 --
v parsnip   0.2.1      v rsample   0.1.1 
v dplyr     1.0.9      v tibble    3.1.7 
v yardstick 0.0.9      v tune      0.1.6
R ile Ağaç Tabanlı Modellerle Machine Learning

Bir karar ağacı oluşturun

Belirtim / işlevsel tasarım

 1. Bir model sınıfı seçin

library(tidymodels)

decision_tree()
Karar Ağacı Model Belirtimi (bilinmiyor)
R ile Ağaç Tabanlı Modellerle Machine Learning

Bir karar ağacı oluşturun

 2. Modelinizi çalıştıran motoru ayarlayın

library(tidymodels)

decision_tree() %>% 
    set_engine("rpart")
Karar Ağacı Model Belirtimi (bilinmiyor)

Hesaplama motoru: rpart
R ile Ağaç Tabanlı Modellerle Machine Learning

Bir karar ağacı oluşturun

 3. Modu ayarlayın (sınıflandırma veya regresyon)

library(tidymodels)

decision_tree() %>% 
     set_engine("rpart") %>% 
     set_mode("classification")
Karar Ağacı Model Belirtimi (sınıflandırma)

Hesaplama motoru: rpart
R ile Ağaç Tabanlı Modellerle Machine Learning

Model belirtiminden gerçek modele

Belirtim bir iskelettir; eğitilmek için veriye ihtiyaç duyar
library(tidymodels)
tree_spec <- decision_tree() %>% 
               set_engine("rpart") %>% 
               set_mode("classification")
# Bir model belirtimi, formül ile eğitim verisine fit edilir
tree_spec %>%           
  fit(formula = outcome ~ age + bmi,  
      data = diabetes)
parsnip model nesnesi
Fit süresi: 19 ms 
n = 652
R ile Ağaç Tabanlı Modellerle Machine Learning

Hadi bir model kuralım!

R ile Ağaç Tabanlı Modellerle Machine Learning

Preparing Video For Download...