Python ile Ağaç Tabanlı Modellerle Machine Learning
Elie Kawerk
Data Scientist

$f$'i en iyi yaklaştıran bir model $\hat{f}$ bulun: $\hat{f} \approx f$
$\hat{f}$ Lojistik Regresyon, Karar Ağacı, Sinir Ağı olabilir...
Gürültüyü olabildiğince ayıklayın.
Nihai hedef: $\hat{f}$ görülmemiş veri kümelerinde düşük kestirim hatası yapmalı.
Aşırı uyum (Overfitting):
$\hat{f}(x)$ eğitim kümesindeki gürültüyü uydurur.
Yetersiz uyum (Underfitting):
$\hat{f}$, $f$'i yaklaştıracak kadar esnek değildir.


$\hat{f}$'in Genelleme Hatası: $\hat{f}$ görülmemiş veride iyi geneller mi?
Şu şekilde ayrıştırılır:
$\hat{f}$'in Genelleme Hatası = sapma^2 + varyans + indirgenemez hata


Model Karmaşıklığı: $\hat{f}$'in esnekliğini belirler.
Örnek: Maksimum ağaç derinliği, yaprak başına minimum örnek sayısı, ...


Python ile Ağaç Tabanlı Modellerle Machine Learning