Python'da Kategorik Verilerle Çalışma
Kasey Jones
Research Data Scientist
Temeller:
n - 1 arasında bir tamsayıyla kodlar; burada n kategori sayısıdır-1 ayrılmıştırDezavantajı:
Kategorik tipe çevirin ve üretici adına göre sıralayın
used_cars['manufacturer_name'] = used_cars['manufacturer_name'].astype("category")
.cat.codes kullanın
used_cars['manufacturer_code'] = used_cars['manufacturer_name'].cat.codes
print(used_cars[['manufacturer_name', 'manufacturer_code']])
manufacturer_name manufacturer_code
0 Subaru 45
1 Subaru 45
2 Subaru 45
... ... ...
38526 Chrysler 8
38527 Chrysler 8

codes = used_cars['manufacturer_name'].cat.codes
categories = used_cars['manufacturer_name']
name_map = dict(zip(codes, categories))print(name_map)
{45: 'Subaru',
24: 'LADA',
12: 'Dodge',
...
}
Kodları oluşturma:
used_cars['manufacturer_code'] = used_cars['manufacturer_name'].cat.codes
Önceki değerlere döndürme:
used_cars['manufacturer_code'].map(name_map)
0 Acura
1 Acura
2 Acura
...
İçinde "van" geçen tüm gövde türlerini bulun:
# Önceki dersten kod:
used_cars["body_type"].str.contains("van", regex=False)
Boolean kodlama oluşturun:
used_cars["van_code"] = np.where( used_cars["body_type"].str.contains("van", regex=False), 1, 0)used_cars["van_code"].value_counts()
0 34115
1 4416
Name: van_code, dtype: int64
Python'da Kategorik Verilerle Çalışma