Faktorbeziehungen und Verteilungen

Explorative Datenanalyse in Python

Izzy Weber

Curriculum Manager, DataCamp

Bildungsniveau: Ehemann

divorce["education_man"].value_counts()
Professional    1313
Preparatory      501
Secondary        288
Primary          100
None               4
Other              3
Name: education_man, dtype: int64
Explorative Datenanalyse in Python

Untersuchung kategorialer Beziehungen

sns.histplot(data=divorce, x="marriage_duration", binwidth=1)
plt.show()

Histogramm der Ehedauer

Explorative Datenanalyse in Python

Untersuchung kategorialer Beziehungen

sns.histplot(data=divorce, x="marriage_duration", hue="education_man", binwidth=1)
plt.show()

Histogramm der Ehedauer, farblich nach „education_man“ sortiert

Explorative Datenanalyse in Python

Kerndichteschätzung (KDE)

sns.kdeplot(data=divorce, x="marriage_duration", hue="education_man")
plt.show()

KDE zur Dauer der Ehe mit „hue“ gleich „education_man“

Explorative Datenanalyse in Python

Kerndichteschätzung (KDE)

Ehedauer KDE mit „hue“ gleich „education_man“ und hervorgehobenem Bereich bei einer Ehedauer von Null

Explorative Datenanalyse in Python

Kerndichteschätzung (KDE)

sns.kdeplot(data=divorce, x="marriage_duration", hue="education_man", cut=0)
plt.show()

KDE zur Dauer der Ehe mit „hue“ gleich „education_man” und „cut“ gleich Null

Explorative Datenanalyse in Python

Kumulative KDE-Plots

sns.kdeplot(data=divorce, x="marriage_duration", hue="education_man", cut=0, cumulative=True)
plt.show()

Kumulative Verteilungsfunktion der Ehedauer mit „hue“ gleich „education_man” und „cut“ gleich Null

Explorative Datenanalyse in Python

Zusammenhang zwischen Heiratsalter und Bildung

  • Gibt es einen Zusammenhang zwischen dem Heiratsalter und dem Bildungsniveau?
divorce["man_age_marriage"] = divorce["marriage_year"] - divorce["dob_man"].dt.year
divorce["woman_age_marriage"] = divorce["marriage_year"] - divorce["dob_woman"].dt.year
Explorative Datenanalyse in Python

Streudiagramm mit kategorialen Variablen

sns.scatterplot(data=divorce, x="woman_age_marriage", y="man_age_marriage")
plt.show()

Ein Streudiagramm von „woman_age_marriage“ und „man_age_marriage“

Explorative Datenanalyse in Python

Streudiagramm mit kategorialen Variablen

sns.scatterplot(data=divorce, 
                x="woman_age_marriage",
                y="man_age_marriage", 
                hue="education_man")
plt.show()

Ein Streudiagramm von „woman_age_marriage“ und „man_age_marriage“ mit der „hue“ gleich „education_man“

Explorative Datenanalyse in Python

Lass uns üben!

Explorative Datenanalyse in Python

Preparing Video For Download...