Penyetelan Hyperparameter di Python
Alex Scriven
Data Scientist
Dalam evolusi genetika di dunia nyata, prosesnya sebagai berikut:
Kita dapat menerapkan ide yang sama untuk penalaan hiperparameter:
Ini adalah pencarian terinformasikan dengan beberapa keunggulan:
Library yang berguna untuk penalaan hiperparameter genetika adalah TPOT:
Anggap TPOT sebagai Asisten Data Science Anda. TPOT adalah alat AutoML Python yang mengoptimalkan pipeline machine learning menggunakan pemrograman genetika.
Pipeline tidak hanya mencakup model (atau beberapa model), tetapi juga fitur dan aspek proses lainnya. Selain itu, TPOT mengembalikan kode Python dari pipeline untuk Anda!
Argumen utama untuk classifier TPOT adalah:
generations: Jumlah iterasi pelatihan.population_size: Jumlah model yang disimpan tiap iterasi.offspring_size: Jumlah model yang dibuat tiap iterasi.mutation_rate: Proporsi pipeline yang diberi keacakan.crossover_rate: Proporsi pipeline yang dikawinkan tiap iterasi.scoring: Fungsi untuk menentukan model terbaik.cv: Strategi cross-validation yang digunakan.Contoh sederhana:
from tpot import TPOTClassifier tpot = TPOTClassifier(generations=3, population_size=5, verbosity=2, offspring_size=10, scoring='accuracy', cv=5)tpot.fit(X_train, y_train) print(tpot.score(X_test, y_test))
Kita akan mempertahankan nilai default untuk mutation_rate dan crossover_rate karena sebaiknya dibiarkan default tanpa pengetahuan mendalam tentang pemrograman genetika.
Perhatikan: Tidak ada hiperparameter khusus algoritme?
Penyetelan Hyperparameter di Python