Data verkennen met visualisaties

Data manipulatie in Julia

Katerina Zahradova

Instructor

Waarom visualiseren?

Row year   mean_min_wage_2020_dollars
    Int64  Float64
________________________________
1   1968   9.28529
2   1969   8.80667
3   1970   9.21882
4   1971   8.82686
5   1972   10.0457
...

Gemiddeld effectief loon in dollars van 2020

Data manipulatie in Julia

Histogram

# Maak een histogram met standaard bins
wages_2015 = filter(wages.year == 2015, wages)
histogram(wages_2015.eff_min_wage_2020_dollars)

Histogram van inflatie-gecorrigeerd minimumloon in 2015

# Aantal bins opgeven
wages_2015 = filter(wages.year == 2015, wages)
histogram(wages_2015.eff_min_wage_2020_dollars,
          bins = 25)

Histogram van inflatie-gecorrigeerd minimumloon in 2015 met labels

Data manipulatie in Julia

Labels toevoegen

# Maak histogram
wages_2015 = filter(wages.year == 2015, wages)
histogram(wages_2015.eff_min_wage_2020_dollars)

# x-label toevoegen xlabel!("Inflatiegecorrigeerd uurloon (USD)")
# y-label toevoegen ylabel!("# staten")
# Titel toevoegen title!("Verdeling van het inflatiegecorrigeerde minimumloon in 2015")

Histogram van cacaopercentages met labels

Data manipulatie in Julia

Scatterplot

# Scatterplot
scatter(penguins.body_mass_g, 
        penguins.flipper_length_mm)

# Labels
xlabel!("Lichaamsmassa [g]")
ylabel!("Vleugellengte [mm]")
title!("Vleugellengte vs. 
        lichaamsmassa bij pinguïns")

Scatterplot van vleugellengte vs. lichaamsmassa voor pinguïns

Data manipulatie in Julia

Lijndiagram

# Aantal Adelie-pinguïns in de tijd
plot(observations.days, 
    observations.adelie)

# Labels
xlabel!("Dagen")
ylabel!("Aantal pinguïns")
title!("Waargenomen aantal 
        pinguïns in de tijd")

Lijndiagram met trends in pinguïnaantallen

Data manipulatie in Julia

Meerdere lijnen

# Teken de eerste lijn
plot(observations.day, observations.adelie)


# Nieuwe lijnen toevoegen en aanpassen plot!(observations.day, observations.chinstrap) plot!(observations.day, observations.gentoo)
# Labels xlabel!("Dagen") ylabel!("Aantal pinguïns") title!("Waargenomen aantal pinguïns in de tijd")

Lijndiagram met trends in pinguïnaantallen per soort

Data manipulatie in Julia

Meerdere lijnen met legenda

# Maak een plot
plot(observations.day, observatations.adelie, 
    label = "Adelie" )
plot!(observations.day, observations.chinstrap, 
    label = "Chinstrap")
plot!(observations.day, observations.gentoo, 
    label = "Gentoo")

# Labels
xlabel!("Dagen")
ylabel!("Aantal pinguïns")
title!("Waargenomen aantal pinguïns in de tijd")

Lijndiagram met trends in pinguïnaantallen per soort met legenda

Data manipulatie in Julia

Spiekbrief

Soorten plots:

  • Histogram - verdeling van een numerieke variabele histogram(df.n1, label = "n1")

  • Scatterplot - relatie tussen twee numerieke variabelen scatter(df.x, df.y, label = "y")

  • Lijndiagram - tijdverloop van een numerieke variabele plot(df.x, df.y, label = "y")

Extra lijn toevoegen aan bestaande plot:

  • histogram!(df.n2, label = "n2")
  • scatter!(df.x2, df.y2, label = "y2")
  • plot!(df.x2, df.y2, label = "y2")

Labels:

  • xlabel!("Tekst van je x-label")
  • ylabel!("Tekst van je y-label")
  • title!("Tekst van je titel")
Data manipulatie in Julia

Laten we oefenen!

Data manipulatie in Julia

Preparing Video For Download...