Kolommen bewerken

Data manipulatie in Julia

Katerina Zahradova

Instructor

Functies toepassen

  • Functies op hele kolommen

    • Kenmerken op basis van hele kolom, bijv. mean, minimum, etc.
    • In Julia schrijf je functies zoals maximum voluit als maximum(), niet alleen max()
  • Functies op individuele regels

Data manipulatie in Julia

Opties

  • select()

  • transform()

  • combine()

Een DataFrame in-place muteren:

  • select!(), transform!(), combine!()
Data manipulatie in Julia

select()

# Kolommen selecteren
select(penguins, :species, :body_mass_g)
333x2 DataFrame
Row species   body_mass_g
    String15  Int64
___________________________
1   Adelie    3750
2   Adelie    3800
3   Adelie    3250
...
# Kolommen selecteren en hernoemen
select(penguins, :species, :body_mass_g => :weight_g)
333x2 DataFrame
Row species   weight_g
    String15  Int64
___________________________
1   Adelie    3750
2   Adelie    3800
3   Adelie    3250
...
Data manipulatie in Julia

select()

# Kolommen selecteren en functies toepassen
select(penguins, :species, :body_mass_g => mean)
333x2 DataFrame
Row species   body_mass_g_mm
    String15  Float64
___________________________
1   Adelie    4207.06
2   Adelie    4207.06
3   Adelie    4207.06
...
Data manipulatie in Julia

transform()

# Kolom toevoegen met maximum van body_mass_g
transform(penguins, :body_mass_g => maximum)
333x8 DataFrame
Row species   island    ...  body_mass_g  sex      body_mass_g_maximum
    String15  String15  ...  Int64        String7  Float64 
___________________________________________________________________
1   Adelie    Torgersen ...  3750         MALE     4207.06
2   Adelie    Torgersen ...  3800         FEMALE   4207.06
...
Data manipulatie in Julia

combine()

# Samenvoegen met het maximum van body_mass_g
combine(penguins, :body_mass_g => maximum)
1×1 DataFrame
Row  body_mass_g_mean
     Float64
__________________________
1    4207.06

Data manipulatie in Julia

Omgaan met meerdere

# Meerdere functies op één kolom
combine(penguins, :body_mass_g .=> [mean, minimum, maximum])
Row  body_mass_g_mean  body_mass_g_minimum  body_mass_g_maximum
     Float64           Float64              Float64       
_______________________________________________________________
1    4207.06           2700                 6300
# Meerdere kolommen aan één functie doorgeven
select(penguins, [:body_mass_g, :flipper_length_mm] .=> mean)
Row  body_mass_g_mean  flipper_length_mm_mean  
     Float64           Float64              
___________________________________________
1    4207.06           200.967               
2    4207.06           200.967   
...
Data manipulatie in Julia

Spiekbrief

  • select():

    • Neemt alleen gespecificeerde kolommen op
    • Zelfde aantal rijen; dezelfde waarde wordt over alle rijen gebroadcast
  • transform():

    • Houdt alle kolommen en voegt nieuwe toe
    • Zelfde aantal rijen; dezelfde waarde wordt over alle rijen gebroadcast
  • combine():

    • Neemt alleen gespecificeerde kolommen op
    • Broadcast de waarden niet over alle rijen
Data manipulatie in Julia

Laten we oefenen!

Data manipulatie in Julia

Preparing Video For Download...