Regressiemodellen

Modelvalidatie in Python

Kasey Jones

Data Scientist

Random forests in scikit-learn

from sklearn.ensemble import RandomForestRegressor
from sklearn.ensemble import RandomForestClassifier
rfr = RandomForestRegressor(random_state=1111)
rfc = RandomForestClassifier(random_state=1111)
Modelvalidatie in Python

Beslisbomen starten met alle punten en splitsen bovenaan. Volg per datapunt verschillende paden door de takken, op basis van de kenmerken.

Modelvalidatie in Python

Een random forest neemt na het trainen het gemiddelde van de uitkomsten van de losse beslisbomen per datapunt voor de uiteindelijke voorspelling.

Modelvalidatie in Python

Random-forestparameters

n_estimators: aantal bomen in het bos

max_depth: maximale boomdiepte

random_state: random seed

from sklearn.ensemble import RandomForestRegressor
rfr = RandomForestRegressor(n_estimators=50, max_depth=10)
rfr = RandomForestRegressor(random_state=1111)
rfr.n_estimators = 50
rfr.max_depth = 10
Modelvalidatie in Python

Feature importance

Print hoe belangrijk elke kolom is voor het model

for i, item in enumerate(rfr.feature_importances_):
    print("{0:s}: {1:.2f}".format(X.columns[i], item))
weight: 0.50
height: 0.39
left_handed: 0.72
union_preference: 0.05
eye_color: 0.03
Modelvalidatie in Python

Laten we beginnen

Modelvalidatie in Python

Preparing Video For Download...