Modelagem de Risco de Crédito em Python
Michael Crabtree
Data Scientist, Ford Motor Company
prob_defaultloan_status previstopreds_df['loan_status'] = preds_df['prob_default'].apply(lambda x: 1 if x > 0.4 else 0)
| Loan | prob_default | threshold | loan_status |
|---|---|---|---|
| 1 | 0.25 | 0.4 | 0 |
| 2 | 0.42 | 0.4 | 1 |
| 3 | 0.75 | 0.4 | 1 |
prob_defaultimport numpy as np
# Compute the threshold for 85% acceptance rate
threshold = np.quantile(prob_default, 0.85)
0.804
| Loan | prob_default |
Threshold | Predicted loan_status |
Accept or Reject |
|---|---|---|---|---|
| 1 | 0.65 | 0.804 | 0 | Accept |
| 2 | 0.85 | 0.804 | 1 | Reject |
loan_status usando o novo limiar# Compute the quantile on the probabilities of default
preds_df['loan_status'] = preds_df['prob_default'].apply(lambda x: 1 if x > 0.804 else 0)
prob_default perto da faixa onde o modelo não está bem calibrado#Calculate the bad rate
np.sum(accepted_loans['true_loan_status']) / accepted_loans['true_loan_status'].count()
0 e inadimplente é 1, então sum() é a contagem de inadimplentes.count() de uma única coluna é igual ao número de linhas do data frameModelagem de Risco de Crédito em Python