Penskalaan dan transformasi

Rekayasa Fitur untuk Machine Learning di Python

Robert O'Callaghan

Data Scientist

Penskalaan data

Rekayasa Fitur untuk Machine Learning di Python

Penskalaan Min-Max

Penyusutan Min-Max

Rekayasa Fitur untuk Machine Learning di Python

Penskalaan Min-Max

Rekayasa Fitur untuk Machine Learning di Python

Penskalaan Min-Max di Python

from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()

scaler.fit(df[['Age']])

df['normalized_age'] = scaler.transform(df[['Age']])
Rekayasa Fitur untuk Machine Learning di Python

Standarisasi

Rekayasa Fitur untuk Machine Learning di Python

Standarisasi di Python

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()

scaler.fit(df[['Age']])

df['standardized_col'] = scaler\
                        .transform(df[['Age']])
Rekayasa Fitur untuk Machine Learning di Python

Transformasi log

gambar log

Rekayasa Fitur untuk Machine Learning di Python

Transformasi log di Python

from sklearn.preprocessing import PowerTransformer

log = PowerTransformer()

log.fit(df[['ConvertedSalary']])

df['log_ConvertedSalary'] = 
     log.transform(df[['ConvertedSalary']])
Rekayasa Fitur untuk Machine Learning di Python

Slide akhir

Rekayasa Fitur untuk Machine Learning di Python

Preparing Video For Download...