Modelvalidatie in Python
Kasey Jones
Data Scientist
Parameters zijn:
Parameters ontstaan door een model te fitten:
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
lr.fit(X, y)
print(lr.coef_, lr.intercept_)
[[0.798, 0.452]] [1.786]
Parameters bestaan niet vóór het model gefit is:
lr = LinearRegression()
print(lr.coef_, lr.intercept_)
AttributeError: 'LinearRegression' object has no attribute 'coef_'
Hyperparameters:
| Hyperparameter | Beschrijving | Mogelijke waarden (default) |
|---|---|---|
| n_estimators | Aantal beslisbomen in het bos | 2+ (10) |
| max_depth | Maximale diepte van de beslisbomen | 2+ (None) |
| max_features | Aantal features om te overwegen bij een split | Zie documentatie |
| min_samples_split | Min. aantal samples dat nodig is voor een split | 2+ (2) |
Hyperparameter-tuning:
depth = [4, 6, 8, 10, 12] samples = [2, 4, 6, 8] features = [2, 4, 6, 8, 10]# Specificeer hyperparameters rfc = RandomForestRegressor( n_estimators=100, max_depth=depth[0], min_samples_split=samples[3], max_features=features[1])rfr.get_params()
{'bootstrap': True,
'criterion': 'mse'
...
}
rfr.get_params()
{'bootstrap': True,
'criterion': 'mse',
'max_depth': 4,
'max_features': 4,
'max_leaf_nodes': None,
'min_impurity_decrease': 0.0,
'min_impurity_split': None,
'min_samples_leaf': 1,
'min_samples_split': 8,
...
}
Modelvalidatie in Python