Model regresi

Validasi Model di Python

Kasey Jones

Data Scientist

Random forest di scikit-learn

from sklearn.ensemble import RandomForestRegressor
from sklearn.ensemble import RandomForestClassifier
rfr = RandomForestRegressor(random_state=1111)
rfc = RandomForestClassifier(random_state=1111)
Validasi Model di Python

Pohon keputusan dimulai dengan semua poin lalu bercabang berdasarkan berbagai pemisahan. Bayangkan mengikuti jalur pada cabang pohon untuk tiap data, sesuai karakteristiknya.

Validasi Model di Python

Setelah random forest selesai, prediksi akhir diperoleh dengan merata-ratakan hasil dari setiap pohon keputusan untuk tiap data.

Validasi Model di Python

Parameter random forest

n_estimators: jumlah pohon dalam forest

max_depth: kedalaman maksimum pohon

random_state: seed acak

from sklearn.ensemble import RandomForestRegressor
rfr = RandomForestRegressor(n_estimators=50, max_depth=10)
rfr = RandomForestRegressor(random_state=1111)
rfr.n_estimators = 50
rfr.max_depth = 10
Validasi Model di Python

Pentingnya fitur

Cetak pentingnya tiap kolom bagi model

for i, item in enumerate(rfr.feature_importances_):
    print("{0:s}: {1:.2f}".format(X.columns[i], item))
weight: 0.50
height: 0.39
left_handed: 0.72
union_preference: 0.05
eye_color: 0.03
Validasi Model di Python

Mari mulai

Validasi Model di Python

Preparing Video For Download...