Categorische data visualiseren

Interactieve datavisualisatie met Bokeh

George Boorman

Core Curriculum Manager, DataCamp

Categorische data

  • Categorische data heeft een vaste set opties of labels.

    • Voorbeelden: gender of geboorteland.
  • Factors zijn een andere term voor categorische variabelen

print(nba[["position", "team", "conference"]].head())
    position    team    conference
0   PG          OKC     West
1   PG          HOU     West
2   PG          BOS     East
3   C           NO      West
4   SG          TOR     East
Interactieve datavisualisatie met Bokeh

Sorteren

ongesorteerde_staafgrafiek

pos = nba.groupby("position")["points"].mean()
pos = pos.sort_values("points", ascending=False)

fig = figure(x_range=pos["position"], x_axis_label="Position", y_axis_label="Points per Game") fig.vbar(x=pos["position"], top=pos["points"]) output_file(filename="sorted_plot.html") show(fig)

gesorteerde_staafgrafiek

Interactieve datavisualisatie met Bokeh

Opvulling

fig = figure(x_range=nba["position"], 
             x_axis_label="Position", 
             y_axis_label="Points per Game")
fig.vbar(x=nba["position"], top=nba["points"],

width=0.9)
output_file(filename="padded_plot.html") show(fig)

gesorteerde_uitgevulde_staafgrafiek

Interactieve datavisualisatie met Bokeh

Oriëntatie

fig = figure(x_range=nba['position'], 
             x_axis_label="Position", 
             y_axis_label="Points per Game")
fig.vbar(x=nba["position"], top=nba["points"], width=0.9)

fig.xaxis.major_label_orientation = 45
output_file(filename="rotated_x_label_plot.html") show(fig)
Interactieve datavisualisatie met Bokeh

Geroteerde x-aslabels

georiënteerde_plot

Interactieve datavisualisatie met Bokeh

Geneste categorieën

positions = ["Point Guard", "Shooting Guard", 
            "Small Forward", "Power Forward", "Center"]
conferences = ["East", "West"]

factors = [("Point Guard", "East"), ("Point Guard", "West"), ("Shooting Guard", "East"), ("Shooting Guard", "West"), ("Small Forward", "East"), ("Small Forward", "West"), ("Power Forward", "East"), ("Power Forward", "West"), ("Center", "East"), ("Center", "West")]
Interactieve datavisualisatie met Bokeh

Een gegroepeerde staafgrafiek maken

from bokeh.models import FactorRange

fig = figure(x_range=FactorRange(*factors), y_axis_label="Points per Game")
fig.vbar(x=factors, top=nba["points"], width=0.9)
output_file(filename="grouped_bar_plot.html") show(fig)
Interactieve datavisualisatie met Bokeh

Gegroepeerde staafgrafiek

gegroepeerde_staafgrafiek

Interactieve datavisualisatie met Bokeh

Laten we oefenen!

Interactieve datavisualisatie met Bokeh

Preparing Video For Download...