Logistische Regression für Ausfallwahrscheinlichkeit

Kreditrisikomodellierung in Python

Michael Crabtree

Data Scientist, Ford Motor Company

Ausfallwahrscheinlichkeit

Die Wahrscheinlichkeit, dass jemand mit einem Kredit ausfällt, ist die Ausfallwahrscheinlichkeit
Ein Wahrscheinlichkeitswert zwischen 0 und 1, z. B. 0.86
loan_status von 1 bedeutet Ausfall, 0 kein Ausfall

Die Wahrscheinlichkeit, dass jemand mit einem Kredit ausfällt, ist die Ausfallwahrscheinlichkeit
Ein Wert zwischen 0 und 1, z. B. 0.86
loan_status von 1 bedeutet Ausfall, 0 kein Ausfall

Ausfallwahrscheinlichkeit	Interpretation	Prognostizierter Status
0.4	Unwahrscheinlich, dass Ausfall	0
0.90	Sehr wahrscheinlich, dass Ausfall	1
0.1	Sehr unwahrscheinlich, dass Ausfall	0

Ausfallwahrscheinlichkeiten als Ergebnis von Machine Learning
- Lernen aus Spalten (Features)
Klassifikationsmodelle (Ausfall, kein Ausfall)
Zwei gängige Modelle:
- Logistische Regression
- Entscheidungsbaum

Beispiel für logistische Regression und Entscheidungsbaum

Formel für lineare und logistische Regression

Beispielgrafik für lineare und logistische Regression

from sklearn.linear_model import LogisticRegression

clf_logistic = LogisticRegression(solver='lbfgs')

clf_logistic.fit(training_columns, np.ravel(training_labels))

Teilmenge	Nutzung	Anteil
Train	Aus Daten lernen, um Vorhersagen zu erzeugen	60%
Test	Lernen an neuen, ungesehenen Daten prüfen	40%

X = cr_loan.drop('loan_status', axis = 1)
y = cr_loan[['loan_status']]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4, random_state=123)

Kreditrisikomodellierung in Python