Pemodelan Risiko Kredit dengan Python
Michael Crabtree
Data Scientist, Ford Motor Company
''| Jenis Data Hilang | Hasil Kemungkinan |
|---|---|
| NULL di kolom numerik | Error |
| NULL di kolom string | Error |
| Data Hilang | Interpretasi | Aksi |
|---|---|---|
NULL di loan_status |
Pinjaman baru disetujui | Hapus dari data prediksi |
NULL di person_age |
Usia tidak tercatat/diungkapkan | Ganti dengan median |
isnull()sum().any() memeriksa semua kolomnull_columns = cr_loan.columns[cr_loan.isnull().any()]
cr_loan[null_columns].isnull().sum()
# Total nilai null per kolom
person_home_ownership 25
person_emp_length 895
loan_intent 25
loan_int_rate 3140
cb_person_default_on_file 15
.fillna() dengan fungsi atau metode agregatcr_loan['loan_int_rate'].fillna((cr_loan['loan_int_rate'].mean()), inplace = True)
.drop()indices = cr_loan[cr_loan['person_emp_length'].isnull()].index
cr_loan.drop(indices, inplace=True)
Pemodelan Risiko Kredit dengan Python