Modelagem de Risco de Crédito em Python
Michael Crabtree
Data Scientist, Ford Motor Company
loan_status| Empréstimo | Status real | Status previsto | Valor de quitação | Valor de venda | Ganho/Perda |
|---|---|---|---|---|---|
| 1 | 0 | 1 | $1.500 | $250 | -$1.250 |
| 2 | 0 | 1 | $1.200 | $250 | -$950 |
xgboost, chamado aqui de xgb.fit() como no modelo de regressão logística# Create a logistic regression model
clf_logistic = LogisticRegression()
# Train the logistic regression
clf_logistic.fit(X_train, np.ravel(y_train))
# Create a gradient boosted tree model
clf_gbt = xgb.XGBClassifier()
# Train the gradient boosted tree
clf_gbt.fit(X_train,np.ravel(y_train))
.predict() e .predict_proba().predict_proba() retorna valor entre 0 e 1.predict() retorna 1 ou 0 para loan_status# Prever probabilidades de inadimplência
gbt_preds_prob = clf_gbt.predict_proba(X_test)
# Prever loan_status como 1 ou 0
gbt_preds = clf_gbt.predict(X_test)
# gbt_preds_prob
array([[0.059, 0.940], [0.121, 0.989]])
# gbt_preds
array([1, 1, 0...])
learning_rate: menor torna cada passo mais conservadormax_depth: profundidade máxima de cada árvore; maior = mais complexaxgb.XGBClassifier(learning_rate = 0.2,
max_depth = 4)
Modelagem de Risco de Crédito em Python