Feature engineering voor Machine Learning in Python
Robert O'Callaghan
Director of Data Science, Ordergroove
SurveyDate ConvertedSalary Hobby ... \
0 2/28/18 20:20 NaN Yes ...
1 6/28/18 13:26 70841.0 Yes ...
2 6/6/18 3:37 NaN No ...
3 5/9/18 1:06 21426.0 Yes ...
4 4/12/18 22:41 41671.0 Yes ...
# Verwijder rijen met minimaal één missende waarde
df.dropna(how='any')
# Verwijder rijen met missende waarden in een specifieke kolom
df.dropna(subset=['VersionControl'])
# Vervang missende waarden in een specifieke kolom
# door een gegeven string
df['VersionControl'].fillna(
value='None Given', inplace=True
)
# Leg vast waar waarden niet missen
df['SalaryGiven'] = df['ConvertedSalary'].notnull()
# Verwijder een specifieke kolom
df.drop(columns=['ConvertedSalary'])
Feature engineering voor Machine Learning in Python