Relações e distribuições de fatores

Análise Exploratória de Dados em Python

Izzy Weber

Curriculum Manager, DataCamp

Nível de escolaridade: parceiro homem

divorce["education_man"].value_counts()
Professional    1313
Preparatory      501
Secondary        288
Primary          100
None               4
Other              3
Name: education_man, dtype: int64
Análise Exploratória de Dados em Python

Explorar relações categóricas

sns.histplot(data=divorce, x="marriage_duration", binwidth=1)
plt.show()

Histograma da duração do casamento

Análise Exploratória de Dados em Python

Explorar relações categóricas

sns.histplot(data=divorce, x="marriage_duration", hue="education_man", binwidth=1)
plt.show()

Histograma da duração do casamento codificado por cores de acordo com escolaridade_man

Análise Exploratória de Dados em Python

Gráficos de estimativa de densidade por kernel (KDE)

sns.kdeplot(data=divorce, x="marriage_duration", hue="education_man")
plt.show()

kde da duração do casamento com hue definido como education_man

Análise Exploratória de Dados em Python

Gráficos de estimativa de densidade por kernel (KDE)

kde da duração do casamento com hue definido como education_man, ampliado para marriage_duration igual a zero

Análise Exploratória de Dados em Python

Gráficos de estimativa de densidade por kernel (KDE)

sns.kdeplot(data=divorce, x="marriage_duration", hue="education_man", cut=0)
plt.show()

kde da duração do casamento com hue definido como education_man e cut igual a zero

Análise Exploratória de Dados em Python

Gráficos de densidade cumulativa (KDE)

sns.kdeplot(data=divorce, x="marriage_duration", hue="education_man", cut=0, cumulative=True)
plt.show()

Função de distribuição cumulativa da duração do casamento com hue definido como education_man e cut igual a zero

Análise Exploratória de Dados em Python

Relação entre idade ao casar e educação

  • Há alguma relação entre a idade ao casar e o nível de escolaridade?
divorce["man_age_marriage"] = divorce["marriage_year"] - divorce["dob_man"].dt.year
divorce["woman_age_marriage"] = divorce["marriage_year"] - divorce["dob_woman"].dt.year
Análise Exploratória de Dados em Python

Gráfico de dispersão com variáveis categóricas

sns.scatterplot(data=divorce, x="woman_age_marriage", y="man_age_marriage")
plt.show()

Um gráfico de dispersão de woman_age_marriage e man_age_marriage

Análise Exploratória de Dados em Python

Gráfico de dispersão com variáveis categóricas

sns.scatterplot(data=divorce, 
                x="woman_age_marriage",
                y="man_age_marriage", 
                hue="education_man")
plt.show()

Um gráfico de dispersão de woman_age_marriage e man_age_marriage com hue definido para education_man

Análise Exploratória de Dados em Python

Vamos praticar!

Análise Exploratória de Dados em Python

Preparing Video For Download...