Relaties en verdelingen van factoren

Exploratory Data Analysis in Python

Izzy Weber

Curriculum Manager, DataCamp

Opleidingsniveau: mannelijke partner

divorce["education_man"].value_counts()
Professional    1313
Preparatory      501
Secondary        288
Primary          100
None               4
Other              3
Name: education_man, dtype: int64
Exploratory Data Analysis in Python

Categorische relaties verkennen

sns.histplot(data=divorce, x="marriage_duration", binwidth=1)
plt.show()

Histogram van huwelijksduur

Exploratory Data Analysis in Python

Categorische relaties verkennen

sns.histplot(data=divorce, x="marriage_duration", hue="education_man", binwidth=1)
plt.show()

Histogram van huwelijksduur, ingekleurd naar education_man

Exploratory Data Analysis in Python

Kernel Density Estimate (KDE)-plots

sns.kdeplot(data=divorce, x="marriage_duration", hue="education_man")
plt.show()

kde van huwelijksduur met hue op education_man

Exploratory Data Analysis in Python

Kernel Density Estimate (KDE)-plots

kde van huwelijksduur met hue op education_man, ingezoomd op marriage_duration nul

Exploratory Data Analysis in Python

Kernel Density Estimate (KDE)-plots

sns.kdeplot(data=divorce, x="marriage_duration", hue="education_man", cut=0)
plt.show()

kde van huwelijksduur met hue op education_man en cut gelijk aan nul

Exploratory Data Analysis in Python

Cumulatieve KDE-plots

sns.kdeplot(data=divorce, x="marriage_duration", hue="education_man", cut=0, cumulative=True)
plt.show()

cumulatieve verdelingsfunctie van huwelijksduur met hue op education_man en cut gelijk aan nul

Exploratory Data Analysis in Python

Relatie tussen huwelijksleeftijd en opleiding

  • Is er een relatie tussen huwelijksleeftijd en opleidingsniveau?
divorce["man_age_marriage"] = divorce["marriage_year"] - divorce["dob_man"].dt.year
divorce["woman_age_marriage"] = divorce["marriage_year"] - divorce["dob_woman"].dt.year
Exploratory Data Analysis in Python

Spreidingsdiagram met categorische variabelen

sns.scatterplot(data=divorce, x="woman_age_marriage", y="man_age_marriage")
plt.show()

Een scatterplot van woman_age_marriage en man_age_marriage

Exploratory Data Analysis in Python

Spreidingsdiagram met categorische variabelen

sns.scatterplot(data=divorce, 
                x="woman_age_marriage",
                y="man_age_marriage", 
                hue="education_man")
plt.show()

Een scatterplot van woman_age_marriage en man_age_marriage met hue op education_man

Exploratory Data Analysis in Python

Laten we oefenen!

Exploratory Data Analysis in Python

Preparing Video For Download...