Introdução a gráficos de linha

Introdução à Visualização de Dados com o Seaborn

Content Team

DataCamp

O que são gráficos de linha?

Dois tipos de gráficos relacionais: dispersão e linha

Gráficos de dispersão

  • Cada ponto é uma observação independente

Gráficos de linha

  • Cada ponto representa a mesma "coisa", geralmente ao longo do tempo

Gráfico de linha do preço das ações ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Dados de poluição do ar

  • Estações de coleta pela cidade
  • Amostras de ar dos níveis de dióxido de nitrogênio

Primeiras cinco linhas do DataFrame de poluição do ar

Introdução à Visualização de Dados com o Seaborn

Gráfico de dispersão

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="scatter")

plt.show()

Gráfico de dispersão do dióxido de nitrogênio médio ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Gráfico de linha

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="line")

plt.show()

Gráfico de linha do dióxido de nitrogênio médio ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Subgrupos por localização

Primeiras cinco linhas do DataFrame de poluição do ar por localização

Introdução à Visualização de Dados com o Seaborn

Subgrupos por localização

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line",
            style="location", 
            hue="location")

plt.show()

Gráfico de linha do dióxido de nitrogênio médio ao longo do tempo por região

Introdução à Visualização de Dados com o Seaborn

Adicionando marcadores

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True)

plt.show()

Gráfico de linha com marcadores adicionados

Introdução à Visualização de Dados com o Seaborn

Desativando estilo de linha

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True,
            dashes=False)

plt.show()

Gráfico de linha com marcadores e linhas sólidas

Introdução à Visualização de Dados com o Seaborn

Múltiplas observações por valor de x

Primeiras cinco linhas do DataFrame de poluição do ar por estação

Introdução à Visualização de Dados com o Seaborn

Múltiplas observações por valor de x

Gráfico de dispersão
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="scatter")

plt.show()

Gráfico de dispersão do dióxido de nitrogênio para todas as estações ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Múltiplas observações por valor de x

Gráfico de linha
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line")

plt.show()

Gráfico de linha do dióxido de nitrogênio para todas as estações ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Múltiplas observações por valor de x

A região sombreada é o intervalo de confiança

  • Supõe que o conjunto de dados é uma amostra aleatória
  • 95% de confiança de que a média está dentro deste intervalo
  • Indica incerteza na nossa estimativa

Gráfico de linha do dióxido de nitrogênio para todas as estações ao longo do tempo

Introdução à Visualização de Dados com o Seaborn

Substituindo intervalo de confiança por desvio padrão

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            errorbar="sd")

plt.show()

Gráfico de linha com desvio padrão

Introdução à Visualização de Dados com o Seaborn

Desativando intervalo de confiança

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            errorbar=None)

plt.show()

Gráfico de linha sem intervalo de confiança

Introdução à Visualização de Dados com o Seaborn

Vamos praticar!

Introdução à Visualização de Dados com o Seaborn

Preparing Video For Download...