Manipolare le colonne

Manipolazione dei dati in Julia

Katerina Zahradova

Instructor

Applicare funzioni

  • Funzioni che operano su colonne intere

    • Caratteristiche calcolate sull’intera colonna, es. media, minimo, ecc.
    • In Julia, funzioni come maximum si scrivono per esteso maximum(), non solo max()
  • Funzioni che lavorano su singole righe

Manipolazione dei dati in Julia

Opzioni

  • select()

  • transform()

  • combine()

Per modificare un DataFrame in place:

  • select!(), transform!(), combine!()
Manipolazione dei dati in Julia

select()

# Selezionare colonne
select(penguins, :species, :body_mass_g)
333x2 DataFrame
Row species   body_mass_g
    String15  Int64
___________________________
1   Adelie    3750
2   Adelie    3800
3   Adelie    3250
...
# Selezionare e rinominare colonne
select(penguins, :species, :body_mass_g => :weight_g)
333x2 DataFrame
Row species   weight_g
    String15  Int64
___________________________
1   Adelie    3750
2   Adelie    3800
3   Adelie    3250
...
Manipolazione dei dati in Julia

select()

# Seleziona colonne e applica funzioni
select(penguins, :species, :body_mass_g => mean)
333x2 DataFrame
Row species   body_mass_g_mm
    String15  Float64
___________________________
1   Adelie    4207.06
2   Adelie    4207.06
3   Adelie    4207.06
...
Manipolazione dei dati in Julia

transform()

# Aggiungere una colonna con il massimo di body_mass_g
transform(penguins, :body_mass_g => maximum)
333x8 DataFrame
Row species   island    ...  body_mass_g  sex      body_mass_g_maximum
    String15  String15  ...  Int64        String7  Float64 
___________________________________________________________________
1   Adelie    Torgersen ...  3750         MALE     4207.06
2   Adelie    Torgersen ...  3800         FEMALE   4207.06
...
Manipolazione dei dati in Julia

combine()

# Combinare penguins con il massimo di body_mass_g
combine(penguins, :body_mass_g => maximum)
1×1 DataFrame
Row  body_mass_g_mean
     Float64
__________________________
1    4207.06

Manipolazione dei dati in Julia

Come gestire i multipli

# Usare più funzioni su una colonna
combine(penguins, :body_mass_g .=> [mean, minimum, maximum])
Row  body_mass_g_mean  body_mass_g_minimum  body_mass_g_maximum
     Float64           Float64              Float64       
_______________________________________________________________
1    4207.06           2700                 6300
# Passare più colonne a una funzione
select(penguins, [:body_mass_g, :flipper_length_mm] .=> mean)
Row  body_mass_g_mean  flipper_length_mm_mean  
     Float64           Float64              
___________________________________________
1    4207.06           200.967               
2    4207.06           200.967   
...
Manipolazione dei dati in Julia

Promemoria rapido

  • select():

    • Include solo le colonne specificate
    • Stesso numero di righe; lo stesso valore è replicato su tutte le righe
  • transform():

    • Mantiene tutte le colonne e ne aggiunge di nuove
    • Stesso numero di righe; lo stesso valore è replicato su tutte le righe
  • combine():

    • Include solo le colonne specificate
    • Non replica i valori su tutte le righe
Manipolazione dei dati in Julia

Ayo berlatih!

Manipolazione dei dati in Julia

Preparing Video For Download...