Einführung in Liniendiagramme

Einführung in die Datenvisualisierung mit Seaborn

Content Team

DataCamp

Was sind Liniendiagramme?

Zwei Arten von Beziehungsdiagrammen: Streudiagramme und Liniendiagramme

Streudiagramme

  • Jeder Punkt ist eine unabhängige Beobachtung

Liniendiagramme

  • Jeder Punkt repräsentiert dasselbe "Ding", typischerweise über die Zeit verfolgt

Liniendiagramm des Aktienkurses über die Zeit

Einführung in die Datenvisualisierung mit Seaborn

Luftverschmutzungsdaten

  • Messstationen in der ganzen Stadt
  • Luftproben von Stickstoffdioxidwerten

Erste fünf Zeilen des DataFrames zur Luftverschmutzung

Einführung in die Datenvisualisierung mit Seaborn

Streudiagramm

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="scatter")

plt.show()

Streudiagramm des durchschnittlichen Stickstoffdioxids über die Zeit

Einführung in die Datenvisualisierung mit Seaborn

Liniendiagramm

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="line")

plt.show()

Liniendiagramm des durchschnittlichen Stickstoffdioxids über die Zeit

Einführung in die Datenvisualisierung mit Seaborn

Untergruppen nach Standort

Erste fünf Zeilen des DataFrames zur Luftverschmutzung nach Standort

Einführung in die Datenvisualisierung mit Seaborn

Untergruppen nach Standort

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line",
            style="location", 
            hue="location")

plt.show()

Liniendiagramm des durchschnittlichen Stickstoffdioxids über die Zeit pro Region

Einführung in die Datenvisualisierung mit Seaborn

Marker hinzufügen

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True)

plt.show()

Liniendiagramm mit hinzugefügten Markern

Einführung in die Datenvisualisierung mit Seaborn

Linienstil ausschalten

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True,
            dashes=False)

plt.show()

Liniendiagramm mit Markern und durchgezogenen Linien

Einführung in die Datenvisualisierung mit Seaborn

Mehrere Beobachtungen pro x-Wert

Erste fünf Zeilen des DataFrames zur Luftverschmutzung pro Station

Einführung in die Datenvisualisierung mit Seaborn

Mehrere Beobachtungen pro x-Wert

Streudiagramm
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="scatter")

plt.show()

Streudiagramm des Stickstoffdioxids für alle Stationen über die Zeit

Einführung in die Datenvisualisierung mit Seaborn

Mehrere Beobachtungen pro x-Wert

Liniendiagramm
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line")

plt.show()

Liniendiagramm des Stickstoffdioxids für alle Stationen über die Zeit

Einführung in die Datenvisualisierung mit Seaborn

Mehrere Beobachtungen pro x-Wert

Schattierter Bereich ist das Konfidenzintervall

  • Geht davon aus, dass der Datensatz eine Zufallsstichprobe ist
  • 95% sicher, dass der Mittelwert in diesem Intervall liegt
  • Zeigt Unsicherheit in unserer Schätzung

Liniendiagramm des Stickstoffdioxids für alle Stationen über die Zeit

Einführung in die Datenvisualisierung mit Seaborn

Konfidenzintervall durch Standardabweichung ersetzen

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            errorbar="sd")

plt.show()

Liniendiagramm mit Standardabweichung

Einführung in die Datenvisualisierung mit Seaborn

Konfidenzintervall ausschalten

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            errorbar=None)

plt.show()

Liniendiagramm ohne Konfidenzintervall

Einführung in die Datenvisualisierung mit Seaborn

Lass uns üben!

Einführung in die Datenvisualisierung mit Seaborn

Preparing Video For Download...