Seaborn-balkdiagrammen

Werken met categorische data in Python

Kasey Jones

Research Data Scientist

Traditioneel staafdiagram

# Code provided for clarity
reviews["Traveler type"].value_counts().plot.bar()

Een staafdiagram met het aantal reviews per reizigerstype.

Werken met categorische data in Python

De syntaxis

sns.set(font_scale=1.3)
sns.set_style("darkgrid")

sns.catplot(x="Traveler type", y="Score", data=reviews, kind="bar")

Een categorisch seaborn-balkdiagram voor hotelreviews per reizigerstype van de reviewer.

Werken met categorische data in Python

Categorieën ordenen

reviews["Traveler type"] = reviews["Traveler type"].astype("category")
reviews["Traveler type"].cat.categories
Index(['Business', 'Couples', 'Families', 'Friends', 'Solo'], dtype='object')
Werken met categorische data in Python

Bijgewerkte visualisatie

sns.catplot(x="Traveler type", y="Score", data=reviews, kind="bar")

  • Let op: catplot() heeft een order-parameter
Werken met categorische data in Python

De parameter hue

  • hue:
    • naam van een variabele in data
    • splitst de data op een tweede categorie
    • kleurt ook de grafiek
sns.set(font_scale=1.2)
sns.set_style("darkgrid")
sns.catplot(x="Traveler type", y="Score", data=reviews, kind="bar",
            hue="Tennis court")  # <--- new parameter
Werken met categorische data in Python

Balkdiagram met twee variabelen

Werken met categorische data in Python

Oefenen met balkdiagrammen

Werken met categorische data in Python

Preparing Video For Download...