Regressione logistica per la probabilità di default

Credit Risk Modeling in Python

Michael Crabtree

Data Scientist, Ford Motor Company

Probabilità di default

La probabilità di default è la probabilità che qualcuno non rimborsi un prestito
Valore tra 0 e 1, ad es. 0.86
loan_status pari a 1 = default, 0 = non default

La probabilità di default è la probabilità che qualcuno non rimborsi un prestito
Valore tra 0 e 1, ad es. 0.86
loan_status pari a 1 = default, 0 = non default

Probabilità di default	Interpretazione	Stato prestito previsto
0.4	Poco probabile il default	0
0.90	Molto probabile il default	1
0.1	Molto poco probabile il default	0

Probabilità di default come output del machine learning
- Si impara dai dati nelle colonne (feature)
Modelli di classificazione (default, non default)
Due modelli più comuni:
- Regressione logistica
- Albero decisionale

Esempio di regressione logistica e albero decisionale

Formula per regressione lineare e logistica

Grafico di esempio: regressione lineare vs logistica

from sklearn.linear_model import LogisticRegression

clf_logistic = LogisticRegression(solver='lbfgs')

clf_logistic.fit(training_columns, np.ravel(training_labels))

Sottoinsieme	Uso	Quota
Train	Impara dai dati per generare previsioni	60%
Test	Valuta l’apprendimento su nuovi dati	40%

X = cr_loan.drop('loan_status', axis = 1)
y = cr_loan[['loan_status']]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4, random_state=123)

Credit Risk Modeling in Python