Regresyon ağaçları için performans metrikleri

R ile Ağaç Tabanlı Modellerle Machine Learning

Sandro Raabe

Data Scientist

Performans nasıl ölçülür?

  • Sınıflandırma: doğruluk (karmaşıklık matrisi)
  • Regresyon: “doğru” görecelidir, ikili doğruluk yoktur

$\Rightarrow$ Tahminlerin gerçek değerden ne kadar saptığını ölçün

R ile Ağaç Tabanlı Modellerle Machine Learning

Regresyon için yaygın metrikler

  • Ortalama Mutlak Hata (MAE)
  • Kök Ortalama Karesel Hata (RMSE)

 

MAE sezgisi:

ortalama farkların grafiği

 

 

 

 

 

MAE = kırmızı çubukların ortalama uzunluğu

R ile Ağaç Tabanlı Modellerle Machine Learning

Formüller ve sezgi

 

$$MAE = \frac{1}{n} \sum_{i=1}^n\left| actual_i - predicted_i \right|$$

 

  • "Mutlak sapmaların toplamı / tahmin sayısı"

$$\quad MSE = \quad \frac{1}{n} \sum_{i=1}^n\left( actual_i - predicted_i \right)^2$$

  •                   "Ortalama karesel hata"
R ile Ağaç Tabanlı Modellerle Machine Learning

Formüller ve sezgi

 

$$MAE = \frac{1}{n} \sum_{i=1}^n\left| actual_i - predicted_i \right|$$

 

  • "Mutlak sapmaların toplamı / tahmin sayısı"

$$RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^n\left( actual - predicted \right)^2}$$

  • "Ortalama karesel hatanın karekökü"
  • Büyük hatalar daha fazla ağırlık alır
R ile Ağaç Tabanlı Modellerle Machine Learning

Kodlama: tahminler

# parsnip ve yardstick, tidymodels içinde yer alır
library(tidymodels)
# Tahmin yapın ve test verisine ekleyin
predictions <- predict(model, new_data = chocolate_test) %>%

bind_cols(chocolate_test)
# A tibble: 358 x 7
   .pred final_grade review_date cocoa_percent company_location
   <dbl>       <dbl>       <int>         <dbl> <fct>           
 1  2.5         2.75        2013          0.7  France          
 2  3.64        3.25        2014          0.8  France          
 3  3.3         3.5         2012          0.7  France          
 4  3.25        3.5         2011          0.72 Fiji            
# ... with 354 more rows, and 2 more variables: bean_type <fct>, broad_bean_origin <fct>
R ile Ağaç Tabanlı Modellerle Machine Learning

Kodlama: mae() ve rmse()

# mae() ile değerlendirin
mae(predictions,

estimate = .pred,
truth = final_grade)
# A tibble: 1 x 2
  .metric   .estimate
  <chr>         <dbl>
1 mae           0.363
# rmse() ile değerlendirin
rmse(predictions,
     estimate = .pred,
     truth = final_grade)
# A tibble: 1 x 2
  .metric   .estimate
  <chr>         <dbl>
1 rmse          0.457
R ile Ağaç Tabanlı Modellerle Machine Learning

Hadi değerlendirelim!

R ile Ağaç Tabanlı Modellerle Machine Learning

Preparing Video For Download...