Introdução aos gráficos de linhas

Introdução à Visualização de Dados com o Seaborn

Erin Case

Data Scientist

O que são gráficos de linhas?

Dois tipos de gráficos relacionais: gráficos de dispersão e gráficos de linhas

Gráficos de dispersão

  • Cada ponto do gráfico é uma observação independente

Gráficos de linhas

  • Cada ponto do gráfico representa a mesma “coisa”, normalmente monitorada ao longo do tempo

Gráfico de linhas do preço das ações ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Dados sobre poluição do ar

  • Estações de coleta espalhadas pela cidade
  • Amostras de ar com níveis de dióxido de nitrogênio

Cinco primeiras linhas do DataFrame de poluição do ar

Introdução à Visualização de Dados com o Seaborn

Gráfico de dispersão

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="scatter")

plt.show()

Gráfico de dispersão da média de dióxido de nitrogênio ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Gráfico de linhas

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="line")

plt.show()

Gráfico de linhas da média de dióxido de nitrogênio ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Subgrupos por local

Cinco primeiras linhas do DataFrame de poluição do ar por local

Introdução à Visualização de Dados com o Seaborn

Subgrupos por local

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line",
            style="location", 
            hue="location")

plt.show()

Gráfico de linhas da média de dióxido de nitrogênio ao longo do tempo por região

Introdução à Visualização de Dados com o Seaborn

Como colocar marcadores

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True)

plt.show()

Gráfico de linhas com o acréscimo de marcadores

Introdução à Visualização de Dados com o Seaborn

Como desativar o estilo da linha

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True,
            dashes=False)

plt.show()

Gráfico de linhas com marcadores e linhas sólidas

Introdução à Visualização de Dados com o Seaborn

Várias observações por valor de x

Cinco primeiras linhas do DataFrame de poluição do ar por estação

Introdução à Visualização de Dados com o Seaborn

Várias observações por valor de x

Gráfico de dispersão
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="scatter")

plt.show()

Gráfico de dispersão do dióxido de nitrogênio em todas as estações ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Várias observações por valor de x

Gráfico de linhas
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line")

plt.show()

Gráfico de linhas do dióxido de nitrogênio em todas as estações ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Várias observações por valor de x

A área sombreada é o intervalo de confiança

  • Supõe que o conjunto de dados é uma amostra aleatória
  • 95% de confiança de que a média está nesse intervalo
  • Mostra a incerteza da estimativa

Gráfico de linhas do dióxido de nitrogênio em todas as estações ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Como substituir o intervalo de confiança pelo desvio-padrão

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            ci="sd")

plt.show()

Gráfico de linhas com desvio-padrão

Introdução à Visualização de Dados com o Seaborn

Como desativar o intervalo de confiança

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            ci=None)

plt.show()

Gráfico de linhas sem intervalo de confiança

Introdução à Visualização de Dados com o Seaborn

Vamos praticar!

Introdução à Visualização de Dados com o Seaborn

Preparing Video For Download...