Kreditrisikomodellierung in Python
Michael Crabtree
Data Scientist, Ford Motor Company
0.86loan_status von 1 bedeutet Ausfall, 0 kein Ausfall0.86loan_status von 1 bedeutet Ausfall, 0 kein Ausfall| Ausfallwahrscheinlichkeit | Interpretation | Prognostizierter Status |
|---|---|---|
| 0.4 | Unwahrscheinlich, dass Ausfall | 0 |
| 0.90 | Sehr wahrscheinlich, dass Ausfall | 1 |
| 0.1 | Sehr unwahrscheinlich, dass Ausfall | 0 |
0 und 1from sklearn.linear_model import LogisticRegression
clf_logistic = LogisticRegression(solver='lbfgs')
.fit() verwendenclf_logistic.fit(training_columns, np.ravel(training_labels))
loan_statusloan_status (0,1)| Teilmenge | Nutzung | Anteil |
|---|---|---|
| Train | Aus Daten lernen, um Vorhersagen zu erzeugen | 60% |
| Test | Lernen an neuen, ungesehenen Daten prüfen | 40% |
X = cr_loan.drop('loan_status', axis = 1)
y = cr_loan[['loan_status']]
train_test_split() aus scikit-learn verwendenX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4, random_state=123)
test_size: Anteil der Daten für den Testsatzrandom_state: Zufallssamen für ReproduzierbarkeitKreditrisikomodellierung in Python