Sürekli eksik değerleri doldurma

Python ile Machine Learning için Özellik Mühendisliği

Robert O'Callaghan

Director of Data Science, Ordergroove

Eksik değerleri silme

  • Test kümesinde eksik değerli satırlar silinemez
Python ile Machine Learning için Özellik Mühendisliği

Başka ne yapabilirsiniz?

  • Kategorik sütunlar: Eksikleri en sık görülen değerle ya da 'None' gibi eksikliği belirten bir dizeyle değiştirin
  • Sayısal sütunlar: Eksikleri uygun bir değerle değiştirin
Python ile Machine Learning için Özellik Mühendisliği

Merkezi eğilim ölçüleri

  • Aritmetik ortalama
  • Medyan
Python ile Machine Learning için Özellik Mühendisliği

Merkezi eğilim ölçülerini hesaplama

print(df['ConvertedSalary'].mean())
print(df['ConvertedSalary'].median())
92565.16992481203
55562.0
Python ile Machine Learning için Özellik Mühendisliği

Eksik değerleri doldurun

df['ConvertedSalary'] = df['ConvertedSalary'].fillna(
    df['ConvertedSalary'].mean()
)
df['ConvertedSalary'] = df['ConvertedSalary']\
                         .astype('int64')
Python ile Machine Learning için Özellik Mühendisliği

Değerleri yuvarlama

df['ConvertedSalary'] = df['ConvertedSalary'].fillna(
    round(df['ConvertedSalary'].mean())
)
Python ile Machine Learning için Özellik Mühendisliği

Hadi pratik yapalım!

Python ile Machine Learning için Özellik Mühendisliği

Preparing Video For Download...