Kreditrisikomodellierung in Python
Michael Crabtree
Data Scientist, Ford Motor Company
prob_default gesetztloan_status des Kredits geändertpreds_df['loan_status'] = preds_df['prob_default'].apply(lambda x: 1 if x > 0.4 else 0)
| Loan | prob_default | threshold | loan_status |
|---|---|---|---|
| 1 | 0.25 | 0.4 | 0 |
| 2 | 0.42 | 0.4 | 1 |
| 3 | 0.75 | 0.4 | 1 |
prob_default annehmenimport numpy as np
# Compute the threshold for 85% acceptance rate
threshold = np.quantile(prob_default, 0.85)
0.804
| Loan | prob_default |
Threshold | Predicted loan_status |
Accept or Reject |
|---|---|---|---|---|
| 1 | 0.65 | 0.804 | 0 | Accept |
| 2 | 0.85 | 0.804 | 1 | Reject |
loan_status mit der neuen Schwelle neu zuweisen# Compute the quantile on the probabilities of default
preds_df['loan_status'] = preds_df['prob_default'].apply(lambda x: 1 if x > 0.804 else 0)
prob_default nahe Bereichen, in denen das Modell schlecht kalibriert ist#Calculate the bad rate
np.sum(accepted_loans['true_loan_status']) / accepted_loans['true_loan_status'].count()
0 und Ausfall 1 ist, dann ist sum() die Anzahl der Ausfälle.count() einer einzelnen Spalte entspricht der Zeilenanzahl des DataFramesKreditrisikomodellierung in Python