Modelagem de Risco de Crédito em Python
Michael Crabtree
Data Scientist, Ford Motor Company
0.86loan_status de 1 é inadimplente e 0 é adimplente0.86loan_status de 1 é inadimplente e 0 é adimplente| Probabilidade de inadimplência | Interpretação | Status previsto |
|---|---|---|
| 0.4 | Pouco provável | 0 |
| 0.90 | Muito provável | 1 |
| 0.1 | Muito improvável | 0 |
0 e 1from sklearn.linear_model import LogisticRegression
clf_logistic = LogisticRegression(solver='lbfgs')
.fit() para treinarclf_logistic.fit(training_columns, np.ravel(training_labels))
loan_statusloan_status (0,1)| Subconjunto | Uso | Fração |
|---|---|---|
| Treino | Aprender com os dados para gerar previsões | 60% |
| Teste | Testar o aprendizado em dados novos | 40% |
X = cr_loan.drop('loan_status', axis = 1)
y = cr_loan[['loan_status']]
train_test_split() já disponível no scikit-learnX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4, random_state=123)
test_size: porcentagem para o conjunto de testerandom_state: semente aleatória para reprodutibilidadeModelagem de Risco de Crédito em Python