Padrões ao longo do tempo

Análise Exploratória de Dados em Python

Izzy Weber

Curriculum Manager, DataCamp

Padrões ao longo do tempo

divorce = pd.read_csv("divorce.csv")
divorce.head()
  marriage_date  marriage_duration
0    2000-06-26                5.0
1    2000-02-02                2.0
2    1991-10-09                10.0
3    1993-01-02                10.0
4    1998-12-11                7.0               
Análise Exploratória de Dados em Python

Importar dados DateTime

  • Os dados em DateTime precisam ser declarados explicitamente ao Pandas

 

divorce.dtypes
marriage_date         object
marriage_duration    float64
dtype: object
Análise Exploratória de Dados em Python

Importar dados DateTime

divorce = pd.read_csv("divorce.csv", parse_dates=["marriage_date"])
divorce.dtypes
marriage_date        datetime64[ns]
marriage_duration           float64
dtype: object
Análise Exploratória de Dados em Python

Converter para dados DateTime

  • pd.to_datetime() converte argumentos em dados DateTime

 

divorce["marriage_date"] = pd.to_datetime(divorce["marriage_date"])
divorce.dtypes
marriage_date        datetime64[ns]
marriage_duration           float64
dtype: object
Análise Exploratória de Dados em Python

Criar dados DateTime

divorce.head(2)
   month  day  year  marriage_duration 
0      6   26  2000                5.0 
1      2    2  2000                2.0
divorce["marriage_date"] = pd.to_datetime(divorce[["month", "day", "year"]])
divorce.head(2)
    month  day  year  marriage_duration  marriage_date 

 0      6   26  2000                5.0     2000-06-26 
 1      2    2  2000                2.0     2000-02-02
Análise Exploratória de Dados em Python

Criar dados DateTime

  • Extraia partes de uma data completa usando os atributos dt.month, dt.day e dt.year
divorce["marriage_month"] = divorce["marriage_date"].dt.month
divorce.head()
    marriage_date  marriage_duration  marriage_month 
 0     2000-06-26                5.0               6 
 1     2000-02-02                2.0               2 
 2     1991-10-09               10.0              10 
 3     1993-01-02               10.0               1 
 4     1998-12-11                7.0              12
Análise Exploratória de Dados em Python

Visualizar padrões ao longo do tempo

sns.lineplot(data=divorce, x="marriage_month", y="marriage_duration")
plt.show()

Um gráfico de linha mostrando a relação entre o mês do casamento e a duração do casamento

Análise Exploratória de Dados em Python

Vamos praticar!

Análise Exploratória de Dados em Python

Preparing Video For Download...