Erstellen von Kastendiagrammen

Einführung in die Datenvisualisierung mit Seaborn

Erin Case

Data Scientist

Was ist ein Kastendiagramm?

  • Zeigt die Verteilung von quantitativen Daten
  • Veranschaulicht Median, Streuung, Schiefe und Ausreißer
  • Erleichtert Vergleiche zwischen Gruppen

Kastendiagramm für den Rechnungsbetrag, aufgeschlüsselt nach Wochentagen

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Einführung in die Datenvisualisierung mit Seaborn

Kastendiagramm erstellen

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box")

plt.show()

Kastendiagramm für den Rechnungsbetrag, aufgeschlüsselt nach Tageszeiten

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Einführung in die Datenvisualisierung mit Seaborn

Reihenfolge der Kategorien ändern

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                order=["Dinner", 
                       "Lunch"])

plt.show()

Kastendiagramm mit Abendessen vor Mittagessen

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Einführung in die Datenvisualisierung mit Seaborn

Ausreißer mit `sym` unterdrücken

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                sym="")

plt.show()

Kastendiagramm ohne Ausreißer

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Einführung in die Datenvisualisierung mit Seaborn

Antennen mit `whis` anpassen

  • Standardmäßig reichen die Antennen (Whisker) bis zum 1,5-fachen Interquartilsabstand (IQR)
  • Verlängerung auf 2,0 * IQR: whis=2.0
  • Anzeige des 5. und 95. Perzentils: whis=[5, 95]
  • Anzeige von Minimum und Maximum: whis=[0, 100]
Einführung in die Datenvisualisierung mit Seaborn

Antennen mit `whis` anpassen

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                whis=[0, 100])

plt.show()

Kastendiagramm, bei dem die Antennen auf Minimum und Maximum gesetzt sind

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Einführung in die Datenvisualisierung mit Seaborn

Lass uns üben!

Einführung in die Datenvisualisierung mit Seaborn

Preparing Video For Download...