Distribusi data

Rekayasa Fitur untuk Machine Learning di Python

Robert O'Callaghan

Director of Data Science, Ordergroove

Asumsi distribusi

Rekayasa Fitur untuk Machine Learning di Python

Mengamati data Anda

import matplotlib as plt

df.hist()
plt.show()

Rekayasa Fitur untuk Machine Learning di Python

Mendalami dengan box plot

Rekayasa Fitur untuk Machine Learning di Python

Box plot di pandas

df[['column_1']].boxplot()
plt.show()

Rekayasa Fitur untuk Machine Learning di Python

Memadankan distribusi

import seaborn as sns
sns.pairplot(df)

Rekayasa Fitur untuk Machine Learning di Python

Detail lanjutan tentang distribusi Anda

df.describe()

Rekayasa Fitur untuk Machine Learning di Python

Ayo berlatih!

Rekayasa Fitur untuk Machine Learning di Python

Preparing Video For Download...