Varianten van gradient boosting

Ensemblemethoden in Python

Román de las Heras

Data Scientist, Appodeal

Varianten van gradient boosting

Gradient-boostingalgoritme

  • Extreme Gradient Boosting
  • Light Gradient Boosting Machine
  • Categorical Boosting

Implementaties

  • XGBoost
  • LightGBM
  • CatBoost
Ensemblemethoden in Python

Extreme gradient boosting (XGBoost)

Enkele eigenschappen:

  • Geoptimaliseerd voor gedistribueerd rekenen
  • Van nature parallel trainen
  • Schaalbaar, portable en nauwkeurig
import xgboost as xgb

clf_xgb = xgb.XGBClassifier(
   n_estimators=100,
   learning_rate=None,
   max_depth=None,
   random_state
)
clg_xgb.fit(X_train, y_train)
pred = clf_xgb.predict(X_test)
Ensemblemethoden in Python

Light gradient boosting machine

Enkele eigenschappen:

  • Uitgebracht door Microsoft (2017)
  • Snellere, efficiëntere training
  • Lichter qua opslag
  • Geoptimaliseerd voor parallel en GPU
  • Handig bij grote datasets en snelheids- of geheugenvraagstukken
import lightgbm as lgb

clf_lgb = lgb.LGBMClassifier(
   n_estimators=100,
   learning_rate=0.1,
   max_depth=-1,
   random_state
)
clf_lgb.fit(X_train, y_train)
pred = clf_lgb.predict(X_test)
Ensemblemethoden in Python

Categorical boosting

Enkele eigenschappen:

  • Open source door Yandex (april 2017)
  • Ingebouwde ondersteuning voor categorische features
  • Nauwkeurig en robuust
  • Snel en schaalbaar
  • Gebruiksvriendelijke API
import catboost as cb

clf_cat = cb.CatBoostClassifier(
   n_estimators=None,
   learning_rate=None,
   max_depth=None,
   random_state
)
clf_cat.fit(X_train, y_train)
pred = clf_cat.predict(X_test)
Ensemblemethoden in Python

Laten we oefenen!

Ensemblemethoden in Python

Preparing Video For Download...