End-to-End Machine Learning
Joshua Stapleton
Machine Learning Engineer

df.head()
# Print the first 5 rows
print(heart_disease_df.head())

df.info()
# Print out details
print(heart_disease_df.info())

df.value_counts()
# print the class balance
print(heart_disease_df['target'].value_counts(normalize=True))

Nutze df.isnull()
Verwendung
# prüfen, ob alle Werte in einer Spalte null sind
print(heart_disease_df['oldpeak'].isnull().all())
True
Ausreißerwerte
Können die Modellleistung verzerren
Manchmal nützlich:

Visualisierungen zeigen:
Weitere Visualisierungen:
df['age'].plot(kind='hist')
plt.xlabel('Age')
plt.ylabel('Frequency')
plt.show()

Daten verstehen
Ausreißer erkennen
Hypothesen formulieren
Annahmen prüfen
End-to-End Machine Learning