Python'da Hiperparametre Ayarlama
Alex Scriven
Data Scientist
Bayes Kuralı:
Yeni kanıtları kullanarak bir sonuca dair inançlarımızı yinelemeli olarak güncelleyen istatistiksel yöntem
Bayes Kuralı şu biçimdedir:
$$ P(A \mid B) = \frac{P(B \mid A) \, P(A)}{P(B)} $$
Sol taraf: B gerçekleştiğinde A’nın olasılığı. B yeni bir kanıttır.
Sağ taraf bunu nasıl hesapladığımızdır.
$$ P(A \mid B) = \frac{P(B \mid A) \, P(A)}{P(B)} $$
Bu kafa karıştırıcı olabilir; bunu göstermek için yaygın bir tıbbi tanı örneği kullanalım.
Tıbbi bir örnek:
Herhangi bir kişinin hastalığa sahip olma olasılığı nedir?
$$ P(D) = 0.05 $$
Bu, kanıt olmadan yalnızca öncelimizdir.
Yatkın bir kişinin hastalığa sahip olma olasılığı nedir?
$$ P(D \mid Pre) = \frac{P(Pre \mid D) \, P(D)}{P(pre)} $$
$$ P(D \mid Pre) = \frac{0.2 \, * 0.05}{0.1} = 0.1 $$
Bu mantığı hiperparametre ayarlamaya uygulayabiliriz:
Bayesçi hiperparametre ayarlama yeni olsa da, büyük ve karmaşık ayarlama görevlerinde en iyi kombinasyonları bulmada etkili olduğu için popülerdir
Hyperopt paketine giriş.
Bayesçi hiperparametre ayarlaması için yapacaklarımız:
Izgarayı tanımlamak için birçok seçenek:
Hyperopt ızgarada nokta değerleri değil, her nokta için hiperparametre değerlerine ait olasılıklar kullanır.
Basit bir uniform dağılım kullanacağız; daha fazlası için belgelere bakınız.
Izgarayı kurun:
space = {
'max_depth': hp.quniform('max_depth', 2, 10, 2),
'min_samples_leaf': hp.quniform('min_samples_leaf', 2, 8, 2),
'learning_rate': hp.uniform('learning_rate', 0.01, 1, 55),
}
Amaç fonksiyonu algoritmayı çalıştırır:
def objective(params): params = {'max_depth': int(params['max_depth']), 'min_samples_leaf': int(params['min_samples_leaf']), 'learning_rate': params['learning_rate']} gbm_clf = GradientBoostingClassifier(n_estimators=500, **params)best_score = cross_val_score(gbm_clf, X_train, y_train, scoring='accuracy', cv=10, n_jobs=4).mean() loss = 1 - best_scorewrite_results(best_score, params, iteration) return loss
Algoritmayı çalıştırın:
best_result = fmin(
fn=objective,
space=space,
max_evals=500,
rstate=np.random.default_rng(42),
algo=tpe.suggest)
Python'da Hiperparametre Ayarlama