Modelagem de Risco de Crédito em Python
Michael Crabtree
Data Scientist, Ford Motor Company
''| Tipo de dado ausente | Possível resultado |
|---|---|
| NULL em coluna numérica | Erro |
| NULL em coluna de string | Erro |
| Dado ausente | Interpretação | Ação |
|---|---|---|
NULL em loan_status |
Empréstimo aprovado recentemente | Remover dos dados de previsão |
NULL em person_age |
Idade não registrada ou informada | Substituir pela mediana |
isnull()sum().any() verifica todas as colunasnull_columns = cr_loan.columns[cr_loan.isnull().any()]
cr_loan[null_columns].isnull().sum()
# Total de valores nulos por coluna
person_home_ownership 25
person_emp_length 895
loan_intent 25
loan_int_rate 3140
cb_person_default_on_file 15
.fillna() usando funções agregadascr_loan['loan_int_rate'].fillna((cr_loan['loan_int_rate'].mean()), inplace = True)
.drop()indices = cr_loan[cr_loan['person_emp_length'].isnull()].index
cr_loan.drop(indices, inplace=True)
Modelagem de Risco de Crédito em Python