Creare nuove colonne

Manipolazione dei dati in Julia

Katerina Zahradova

Instructor

Colonne vs righe

Colonna

  • Numero unico per tutte le righe
  • Es. media, mediana, somma, ...

Righe

  • Valori dipendono dai dati di ogni singola riga

=> usa ByRow()

Manipolazione dei dati in Julia

Lunghezza pinna in pollici

# Converti da mm a pollici
transform(penguins, :flipper_length_mm => ByRow(x -> x/25.4) => :flipper_length_inch)
333x8 DataFrame
Row species   island    ...  body_mass_g  sex      flipper_lenght_inch
    String15  String15  ...  Int64        String7  Float64 
___________________________________________________________________
1   Adelie    Torgersen ...  3750         MALE     7.12598
2   Adelie    Torgersen ...  3800         FEMALE   7.32283
...
Manipolazione dei dati in Julia

Rapporto tra profondità e lunghezza del culmen

# Seleziona colonne e calcola il loro rapporto
select(penguins,:culmen_depth_mm, :culmen_length_mm, 
   [:culmen_depth_mm, :culmen_length_mm] => ByRow((x, y) -> x/y) => :culmen_ratio)
333x3 DataFrame
Row  culmen_depth_mm  culmen_length_mm  culmen_ratio
     Float64          Float64           Float64
_____________________________________________________
1    18.7             39.1              0.478261
2    17.4             39.5              0.440506
...
Manipolazione dei dati in Julia

Nuova colonna da un vettore

# Vettore id_vec da aggiungere


# Con [] e : penguins[:, :id_colon] = id_vec
# Con [] e ! penguins[!, :id_exclamation] = id_vec
# Con . penguins.id_dot = id_vec
Manipolazione dei dati in Julia

Copia o riferimento

penguins[:, :id_colon] = id_vec
penguins[!, :id_exclamation] = id_vec
penguins.id_dot = id_vec

# Cambia il primo elemento
id_vec[1] = 27
select(penguins, :species, r"id")
333x4 DataFrame
Row  species   id_colon  id_exclamation  id_dot
     String15  Int64     Int64           Int64
_____________________________________________________
1    Adelie    25        27              27
...
Manipolazione dei dati in Julia

Copia o riferimento

penguins[:, :id_colon] = id_vec        # copia i valori nel DataFrame
penguins[!, :id_exclamation] = id_vec  # riferisce a id_vec
penguins.id_dot = id_vec               # riferisce a id_vec

# Cambia il primo elemento
id_vec[1] = 27
select(penguins, :species, r"id")
333x4 DataFrame
Row  species   id_colon  id_exclamation  id_dot
     String15  Int64     Int64           Int64
_____________________________________________________
1    Adelie    25        27              27
...
Manipolazione dei dati in Julia

Passiamo alla pratica!

Manipolazione dei dati in Julia

Preparing Video For Download...