Modelado del riesgo crediticio en Python
Michael Crabtree
Data Scientist, Ford Motor Company
''| Tipo de dato faltante | Posible resultado |
|---|---|
| NULL en columna numérica | Error |
| NULL en columna de texto | Error |
| Dato faltante | Interpretación | Acción |
|---|---|---|
NULL en loan_status |
Préstamo recién aprobado | Excluir de datos de predicción |
NULL en person_age |
Edad no registrada o no revelada | Reemplazar por la mediana |
isnull()sum().any() revisa todas las columnasnull_columns = cr_loan.columns[cr_loan.isnull().any()]
cr_loan[null_columns].isnull().sum()
# Total de valores nulos por columna
person_home_ownership 25
person_emp_length 895
loan_intent 25
loan_int_rate 3140
cb_person_default_on_file 15
.fillna() usando funciones y métodos agregadoscr_loan['loan_int_rate'].fillna((cr_loan['loan_int_rate'].mean()), inplace = True)
.drop()indices = cr_loan[cr_loan['person_emp_length'].isnull()].index
cr_loan.drop(indices, inplace=True)
Modelado del riesgo crediticio en Python