Esplorare i dati con le visualizzazioni

Manipolazione dei dati in Julia

Katerina Zahradova

Instructor

Perché visualizzare?

Row year   mean_min_wage_2020_dollars
    Int64  Float64
________________________________
1   1968   9.28529
2   1969   8.80667
3   1970   9.21882
4   1971   8.82686
5   1972   10.0457
...

Salario medio effettivo in dollari 2020

Manipolazione dei dati in Julia

Istogramma

# Crea un istogramma con bin predefiniti
wages_2015 = filter(wages.year == 2015, wages)
histogram(wages_2015.eff_min_wage_2020_dollars)

Istogramma del salario minimo corretto per inflazione nel 2015

# Specificare il numero di bin
wages_2015 = filter(wages.year == 2015, wages)
histogram(wages_2015.eff_min_wage_2020_dollars,
          bins = 25)

Istogramma del salario minimo corretto per inflazione nel 2015 con etichette

Manipolazione dei dati in Julia

Etichettare il grafico

# Crea un istogramma
wages_2015 = filter(wages.year == 2015, wages)
histogram(wages_2015.eff_min_wage_2020_dollars)

# Aggiungi etichetta x xlabel!("Salario orario minimo corretto per inflazione (USD)")
# Aggiungi etichetta y ylabel!("# di stati")
# Aggiungi titolo title!("Distribuzione del salario minimo corretto per inflazione nel 2015")

Istogramma delle percentuali di cacao con etichette

Manipolazione dei dati in Julia

Grafico a dispersione

# Grafico a dispersione
scatter(penguins.body_mass_g, 
        penguins.flipper_length_mm)

# Etichette
xlabel!("Massa corporea [g]")
ylabel!("Lunghezza pinna [mm]")
title!("Lunghezza pinna vs 
        massa corporea nei pinguini")

Grafico a dispersione: lunghezza pinna vs massa corporea nei pinguini

Manipolazione dei dati in Julia

Grafico a linee

# Numero di pinguini Adelie nel tempo
plot(observations.days, 
    observations.adelie)

# Etichette
xlabel!("Giorni")
ylabel!("Numero di pinguini")
title!("Numero di pinguini 
        osservati nel tempo")

Line plot con l’andamento del numero di pinguini

Manipolazione dei dati in Julia

Linee multiple

# Traccia la prima linea
plot(observations.day, observations.adelie)


# Aggiungi e modifica con nuove linee plot!(observations.day, observations.chinstrap) plot!(observations.day, observations.gentoo)
# Etichette xlabel!("Giorni") ylabel!("Numero di pinguini") title!("Numero di pinguini osservati nel tempo")

Grafico a linee con l’andamento dei pinguini per specie diverse

Manipolazione dei dati in Julia

Linee multiple con legenda

# Crea un grafico
plot(observations.day, observatations.adelie, 
    label = "Adelie" )
plot!(observations.day, observations.chinstrap, 
    label = "Chinstrap")
plot!(observations.day, observations.gentoo, 
    label = "Gentoo")

# Etichette
xlabel!("Giorni")
ylabel!("Numero di pinguini")
title!("Numero di pinguini osservati nel tempo")

Grafico a linee con l’andamento dei pinguini per specie e legenda

Manipolazione dei dati in Julia

Cheat sheet

Tipi di grafici:

  • Istogramma: distribuzione di una variabile numerica histogram(df.n1, label = "n1")

  • Dispersione: relazione tra due variabili numeriche scatter(df.x, df.y, label = "y")

  • Linea: evoluzione temporale di una variabile numerica plot(df.x, df.y, label = "y")

Aggiungere un’altra linea al grafico:

  • histogram!(df.n2, label = "n2")
  • scatter!(df.x2, df.y2, label = "y2")
  • plot!(df.x2, df.y2, label = "y2")

Etichette:

  • xlabel!("Testo etichetta x")
  • ylabel!("Testo etichetta y")
  • title!("Testo del titolo")
Manipolazione dei dati in Julia

Ayo berlatih!

Manipolazione dei dati in Julia

Preparing Video For Download...