Regresión logística para la probabilidad de impago

Modelado del riesgo crediticio en Python

Michael Crabtree

Data Scientist, Ford Motor Company

Probabilidad de impago

La probabilidad de que alguien no pague un préstamo es la probabilidad de impago
Un valor entre 0 y 1, como 0.86
loan_status de 1 = impago; 0 = no impago

La probabilidad de que alguien no pague un préstamo es la probabilidad de impago
Un valor entre 0 y 1, como 0.86
loan_status de 1 = impago; 0 = no impago

Probabilidad de impago	Interpretación	Estado del préstamo previsto
0.4	Poco probable que impague	0
0.90	Muy probable que impague	1
0.1	Muy poco probable que impague	0

Probabilidades de impago como resultado de machine learning
- Aprende de las columnas (features)
Modelos de clasificación (impago, no impago)
Dos modelos más comunes:
- Regresión logística
- Árbol de decisión

Ejemplo de regresión logística y árbol de decisión

Fórmula de regresión lineal y logística

Gráfico de ejemplo de regresión lineal y logística

from sklearn.linear_model import LogisticRegression

clf_logistic = LogisticRegression(solver='lbfgs')

clf_logistic.fit(training_columns, np.ravel(training_labels))

Subconjunto	Uso	Porcentaje
Train	Aprender de los datos para generar predicciones	60%
Test	Probar el aprendizaje en datos no vistos	40%

X = cr_loan.drop('loan_status', axis = 1)
y = cr_loan[['loan_status']]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4, random_state=123)

Modelado del riesgo crediticio en Python