Data manipulatie in Julia
Katerina Zahradova
Instructor
Row year mean_min_wage_2020_dollars
Int64 Float64
________________________________
1 1968 9.28529
2 1969 8.80667
3 1970 9.21882
4 1971 8.82686
5 1972 10.0457
...

# Maak een histogram met standaard bins
wages_2015 = filter(wages.year == 2015, wages)
histogram(wages_2015.eff_min_wage_2020_dollars)

# Aantal bins opgeven
wages_2015 = filter(wages.year == 2015, wages)
histogram(wages_2015.eff_min_wage_2020_dollars,
bins = 25)

# Maak histogram wages_2015 = filter(wages.year == 2015, wages) histogram(wages_2015.eff_min_wage_2020_dollars)# x-label toevoegen xlabel!("Inflatiegecorrigeerd uurloon (USD)")# y-label toevoegen ylabel!("# staten")# Titel toevoegen title!("Verdeling van het inflatiegecorrigeerde minimumloon in 2015")

# Scatterplot
scatter(penguins.body_mass_g,
penguins.flipper_length_mm)
# Labels
xlabel!("Lichaamsmassa [g]")
ylabel!("Vleugellengte [mm]")
title!("Vleugellengte vs.
lichaamsmassa bij pinguïns")

# Aantal Adelie-pinguïns in de tijd
plot(observations.days,
observations.adelie)
# Labels
xlabel!("Dagen")
ylabel!("Aantal pinguïns")
title!("Waargenomen aantal
pinguïns in de tijd")

# Teken de eerste lijn plot(observations.day, observations.adelie)# Nieuwe lijnen toevoegen en aanpassen plot!(observations.day, observations.chinstrap) plot!(observations.day, observations.gentoo)# Labels xlabel!("Dagen") ylabel!("Aantal pinguïns") title!("Waargenomen aantal pinguïns in de tijd")

# Maak een plot
plot(observations.day, observatations.adelie,
label = "Adelie" )
plot!(observations.day, observations.chinstrap,
label = "Chinstrap")
plot!(observations.day, observations.gentoo,
label = "Gentoo")
# Labels
xlabel!("Dagen")
ylabel!("Aantal pinguïns")
title!("Waargenomen aantal pinguïns in de tijd")

Soorten plots:
Histogram - verdeling van een numerieke variabele
histogram(df.n1, label = "n1")
Scatterplot - relatie tussen twee numerieke variabelen
scatter(df.x, df.y, label = "y")
Lijndiagram - tijdverloop van een numerieke variabele
plot(df.x, df.y, label = "y")
Extra lijn toevoegen aan bestaande plot:
histogram!(df.n2, label = "n2")scatter!(df.x2, df.y2, label = "y2")plot!(df.x2, df.y2, label = "y2")Labels:
xlabel!("Tekst van je x-label")ylabel!("Tekst van je y-label")title!("Tekst van je titel")Data manipulatie in Julia