Aykırı değerleri kaldırma

Python ile Machine Learning için Özellik Mühendisliği

Robert O'Callaghan

Director of Data Science, Ordergroove

Aykırı değerler nedir?

Dağılım görseli

Python ile Machine Learning için Özellik Mühendisliği

Kantile dayalı tespit

Python ile Machine Learning için Özellik Mühendisliği

Python'da kantiller

q_cutoff = df['col_name'].quantile(0.95)

mask = df['col_name'] < q_cutoff

trimmed_df = df[mask]
Python ile Machine Learning için Özellik Mühendisliği

Standart sapmaya dayalı tespit

Python ile Machine Learning için Özellik Mühendisliği

Python'da standart sapma ile tespit

mean = df['col_name'].mean()
std = df['col_name'].std()

cut_off = std * 3 lower, upper = mean - cut_off, mean + cut_off
new_df = df[(df['col_name'] < upper) & (df['col_name'] > lower)]
Python ile Machine Learning için Özellik Mühendisliği

Hadi pratik yapalım!

Python ile Machine Learning için Özellik Mühendisliği

Preparing Video For Download...