Kategorik Değişkenlerle Çalışma

Python ile Machine Learning için Özellik Mühendisliği

Robert O'Callaghan

Director of Data Science, Ordergroove

Kategorik özelliklerin kodlanması

Python ile Machine Learning için Özellik Mühendisliği

Kategorik özelliklerin kodlanması

Python ile Machine Learning için Özellik Mühendisliği

Kategorik özelliklerin kodlanması

  • One-hot encoding
  • Kukla (dummy) kodlama
Python ile Machine Learning için Özellik Mühendisliği

One-hot encoding

pd.get_dummies(df, columns=['Country'], 
               prefix='C')
    C_France    C_India    C_UK    C_USA
0          0          1       0        0
1          0          0       0        1
2          0          0       1        0
3          0          0       1        0
4          1          0       0        0
Python ile Machine Learning için Özellik Mühendisliği

Kukla (dummy) kodlama

pd.get_dummies(df, columns=['Country'],
               drop_first=True, prefix='C')
     C_India    C_UK    C_USA
0          1       0        0
1          0       0        1
2          0       1        0
3          0       1        0
4          0       0        0
Python ile Machine Learning için Özellik Mühendisliği

One-hot ve dummy karşılaştırması

  • One-hot encoding: Açıklanabilir özellikler
  • Kukla (dummy) kodlama: Yinelenmeden gerekli bilgi
Python ile Machine Learning için Özellik Mühendisliği
Index Cinsiyet
0 Erkek
1 Kadın
2 Erkek
Index Erkek Kadın
0 1 0
1 0 1
2 1 0
Index Erkek
0 1
1 0
2 1
Python ile Machine Learning için Özellik Mühendisliği

Sütunları sınırlama

counts = df['Country'].value_counts()
print(counts)
'USA'      8
'UK'       6
'India'    2
'France'   1
Name: Country, dtype: object
Python ile Machine Learning için Özellik Mühendisliği

Sütunları sınırlama

mask = df['Country'].isin(counts[counts < 5].index)

df['Country'][mask] = 'Other'
print(pd.value_counts(colors))
'USA'      8
'UK'       6
'Other'    3
Name: Country, dtype: object
Python ile Machine Learning için Özellik Mühendisliği

Artık kategorik değişkenleri yönetebiliyorsunuz

Python ile Machine Learning için Özellik Mühendisliği

Preparing Video For Download...