End-to-End Machine Learning
Joshua Stapleton
Machine Learning Engineer

df.head()
# Print de eerste 5 rijen
print(heart_disease_df.head())

df.info()
# Print details
print(heart_disease_df.info())

df.value_counts()
# print de class balance
print(heart_disease_df['target'].value_counts(normalize=True))

Gebruik df.isnull()
Gebruik
# check of alle waarden in een kolom null zijn
print(heart_disease_df['oldpeak'].isnull().all())
True
Afwijkende waarden
Kunnen modelprestatie scheeftrekken
Soms nuttig:

Visualisaties tonen:
Andere visualisaties:
df['age'].plot(kind='hist')
plt.xlabel('Age')
plt.ylabel('Frequency')
plt.show()

Begrijp de data
Vind uitschieters
Formuleer hypotheses
Check aannames
End-to-End Machine Learning