Machine Learning dengan Model Berbasis Pohon di Python
Elie Kawerk
Data Scientist

Temukan model $\hat{f}$ yang mendekati $f$: $\hat{f} \approx f$
$\hat{f}$ bisa berupa Logistic Regression, Decision Tree, Neural Network, ...
Buang noise sebanyak mungkin.
Tujuan akhir: $\hat{f}$ mencapai galat prediksi rendah pada data baru.
Overfitting:
$\hat{f}(x)$ menyesuaikan noise pada data latih.
Underfitting:
$\hat{f}$ tidak cukup fleksibel untuk mendekati $f$.


Galat generalisasi $\hat{f}$: Apakah $\hat{f}$ bekerja baik pada data baru?
Dapat diuraikan sebagai berikut:
Galat generalisasi $\hat{f} = bias^2 + varians + \text{galat tak tereduksi}$


Kompleksitas model: menentukan fleksibilitas $\hat{f}$.
Contoh: Kedalaman pohon maks., Minimum sampel per daun, ...


Machine Learning dengan Model Berbasis Pohon di Python