Zähldiagramme und Balkendiagramme

Einführung in die Datenvisualisierung mit Seaborn

Erin Case

Data Scientist

Kategoriale Diagramme

  • Beispiele: Zähldiagramme, Balkendiagramme
  • Visualisierung einer kategorialen Variable
  • Vergleiche zwischen Gruppen

Zähldiagramm für die Antworten in einer Umfrage zum Thema Maskulinität

Einführung in die Datenvisualisierung mit Seaborn

catplot()

  • Erstellung von kategorialen Diagrammen
  • Dieselben Vorteile wie bei relplot()
  • Unterdiagramme mithilfe von col= und row=
Einführung in die Datenvisualisierung mit Seaborn

countplot() vs. catplot()

import matplotlib.pyplot as plt
import seaborn as sns

sns.countplot(x="how_masculine",
              data=masculinity_data)

plt.show()

Zähldiagramm für die Antworten in einer Umfrage zum Thema Maskulinität

Einführung in die Datenvisualisierung mit Seaborn

countplot() vs. catplot()

import matplotlib.pyplot as plt
import seaborn as sns

sns.catplot(x="how_masculine",
            data=masculinity_data,
            kind="count")

plt.show()

Zähldiagramm für die Antworten in einer Umfrage zum Thema Maskulinität

Einführung in die Datenvisualisierung mit Seaborn

Reihenfolge der Kategorien ändern

import matplotlib.pyplot as plt
import seaborn as sns

category_order = ["No answer", "Not at all", "Not very", "Somewhat", "Very"]
sns.catplot(x="how_masculine", data=masculinity_data, kind="count", order=category_order)
plt.show()

Zähldiagramm mit Antworten in einer Umfrage zum Thema Maskulinität in neuer Reihenfolge

Einführung in die Datenvisualisierung mit Seaborn

Balkendiagramme

Anzeige des Mittelwerts pro Kategorie für die quantitative Variable

import matplotlib.pyplot as plt
import seaborn as sns

sns.catplot(x="day",
            y="total_bill",
            data=tips,
            kind="bar")

plt.show()

Balkendiagramm mit dem durchschnittlichen Rechnungsbetrag pro Wochentag

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Einführung in die Datenvisualisierung mit Seaborn

Konfidenzintervalle

  • Linien zeigen die 95-%-Konfidenzintervalle für den Mittelwert
  • Visualisierung der Unsicherheit bei den Schätzungen
  • Annahme: Daten entsprechen einer Zufallsstichprobe

Balkendiagramm mit dem durchschnittlichen Rechnungsbetrag pro Wochentag

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Einführung in die Datenvisualisierung mit Seaborn

Konfidenzintervalle deaktivieren

import matplotlib.pyplot as plt
import seaborn as sns

sns.catplot(x="day",
            y="total_bill",
            data=tips,
            kind="bar",
            ci=None)

plt.show()

Balkendiagramm ohne Konfidenzintervalle

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Einführung in die Datenvisualisierung mit Seaborn

Ausrichtung der Balken ändern

import matplotlib.pyplot as plt
import seaborn as sns

sns.catplot(x="total_bill",
            y="day",
            data=tips,
            kind="bar")

plt.show()

Horizontales Balkendiagramm

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Einführung in die Datenvisualisierung mit Seaborn

Lass uns üben!

Einführung in die Datenvisualisierung mit Seaborn

Preparing Video For Download...