Python'da Hiperparametre Ayarlama
Alex Scriven
Data Scientist
Bir GridSearchCV nesnesine giriş:
sklearn.model_selection.GridSearchCV(
estimator,
param_grid, scoring=None, fit_params=None,
n_jobs=None, refit=True, cv='warn',
verbose=0, pre_dispatch='2*n_jobs',
error_score='raise-deprecating',
return_train_score='warn')
Izgara Aramasındaki adımlar:
Önemli girdiler:
estimatorparam_gridcvscoringrefitn_jobsreturn_train_score
estimator girdisi:
Unutmayın:
param_grid girdisi:
Liste yerine:
max_depth_list = [2, 4, 6, 8]
min_samples_leaf_list = [1, 2, 4, 6]
Bu şöyle olur:
param_grid = {'max_depth': [2, 4, 6, 8],
'min_samples_leaf': [1, 2, 4, 6]}
param_grid girdisi:
Unutmayın: param_grid sözlüğündeki anahtarlar geçerli hiperparametreler olmalıdır.
Örneğin, bir Lojistik regresyon tahmincisi için:
# Incorrect
param_grid = {'C': [0.1,0.2,0.5],
'best_choice': [10,20,50]}
ValueError: Invalid parameter best_choice for estimator LogisticRegression
cv girdisi:

scoring girdisi:
metrics modülünü kullanınTüm yerleşik skorlayıcıları şöyle görebilirsiniz:
from sklearn import metrics
sorted(metrics.SCORERS.keys())
refit girdisi:
GridSearchCV nesnesinin bir tahminci (öngörü) olarak kullanılmasını sağlarn_jobs girdisi:
Faydalı kod:
import os
print(os.cpu_count())
Diğer işler yapacaksanız tüm çekirdekleri modele ayırırken dikkat edin!
return_train_score girdisi:
Kendi GridSearchCV Nesnemizi oluşturma:
# Create the grid param_grid = {'max_depth': [2, 4, 6, 8], 'min_samples_leaf': [1, 2, 4, 6]}#Get a base classifier with some set parameters. rf_class = RandomForestClassifier(criterion='entropy', max_features='auto')
Parçaları birleştirme:
grid_rf_class = GridSearchCV(
estimator = rf_class,
param_grid = parameter_grid,
scoring='accuracy',
n_jobs=4,
cv = 10,
refit=True,
return_train_score=True)
refit değerini True yaptığımız için nesneyi doğrudan kullanabiliriz:
#Fit the object to our data
grid_rf_class.fit(X_train, y_train)
# Make predictions
grid_rf_class.predict(X_test)
Python'da Hiperparametre Ayarlama