Regressão logística para probabilidade de inadimplência

Modelagem de Risco de Crédito em Python

Michael Crabtree

Data Scientist, Ford Motor Company

Probabilidade de inadimplência

Probabilidade de inadimplência	Interpretação	Status previsto
0.4	Pouco provável	0
0.90	Muito provável	1
0.1	Muito improvável	0

Probabilidades de inadimplência como resultado de ML
- Aprender a partir das colunas (features)
Modelos de classificação (inadimplente, adimplente)
Dois modelos mais comuns:
- Regressão logística
- Árvore de decisão

Exemplo de regressão logística e árvore de decisão

Fórmula de regressão linear e regressão logística

Gráfico de exemplo de regressão linear e regressão logística

from sklearn.linear_model import LogisticRegression

clf_logistic = LogisticRegression(solver='lbfgs')

clf_logistic.fit(training_columns, np.ravel(training_labels))

Subconjunto	Uso	Fração
Treino	Aprender com os dados para gerar previsões	60%
Teste	Testar o aprendizado em dados novos	40%

X = cr_loan.drop('loan_status', axis = 1)
y = cr_loan[['loan_status']]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4, random_state=123)

Modelagem de Risco de Crédito em Python