Memanipulasi kolom

Manipulasi Data di Julia

Katerina Zahradova

Instructor

Menerapkan fungsi

  • Fungsi yang menerima seluruh kolom

    • Fitur dihitung dari seluruh kolom, mis. mean, minimum, dll.
    • Di Julia, fungsi seperti maximum ditulis lengkap maximum(), bukan hanya max()
  • Fungsi yang bekerja per baris

Manipulasi Data di Julia

Opsi

  • select()

  • transform()

  • combine()

Untuk memodifikasi DataFrame di tempat:

  • select!(), transform!(), combine!()
Manipulasi Data di Julia

select()

# Memilih kolom
select(penguins, :species, :body_mass_g)
333x2 DataFrame
Row species   body_mass_g
    String15  Int64
___________________________
1   Adelie    3750
2   Adelie    3800
3   Adelie    3250
...
# Memilih dan mengganti nama kolom
select(penguins, :species, :body_mass_g => :weight_g)
333x2 DataFrame
Row species   weight_g
    String15  Int64
___________________________
1   Adelie    3750
2   Adelie    3800
3   Adelie    3250
...
Manipulasi Data di Julia

select()

# Pilih kolom dan terapkan fungsi
select(penguins, :species, :body_mass_g => mean)
333x2 DataFrame
Row species   body_mass_g_mm
    String15  Float64
___________________________
1   Adelie    4207.06
2   Adelie    4207.06
3   Adelie    4207.06
...
Manipulasi Data di Julia

transform()

# Menambahkan kolom berisi maksimum body_mass_g
transform(penguins, :body_mass_g => maximum)
333x8 DataFrame
Row species   island    ...  body_mass_g  sex      body_mass_g_maximum
    String15  String15  ...  Int64        String7  Float64 
___________________________________________________________________
1   Adelie    Torgersen ...  3750         MALE     4207.06
2   Adelie    Torgersen ...  3800         FEMALE   4207.06
...
Manipulasi Data di Julia

combine()

# Menggabungkan penguins dengan nilai maksimum body_mass_g
combine(penguins, :body_mass_g => maximum)
1×1 DataFrame
Row  body_mass_g_mean
     Float64
__________________________
1    4207.06

Manipulasi Data di Julia

Menangani banyak item

# Menggunakan banyak fungsi pada satu kolom
combine(penguins, :body_mass_g .=> [mean, minimum, maximum])
Row  body_mass_g_mean  body_mass_g_minimum  body_mass_g_maximum
     Float64           Float64              Float64       
_______________________________________________________________
1    4207.06           2700                 6300
# Memberikan banyak kolom ke satu fungsi
select(penguins, [:body_mass_g, :flipper_length_mm] .=> mean)
Row  body_mass_g_mean  flipper_length_mm_mean  
     Float64           Float64              
___________________________________________
1    4207.06           200.967               
2    4207.06           200.967   
...
Manipulasi Data di Julia

Ringkasan cepat

  • select():

    • Hanya menyertakan kolom yang dipilih
    • Jumlah baris tetap; nilai yang sama disiarkan ke semua baris
  • transform():

    • Menjaga semua kolom dan menambahkan kolom baru
    • Jumlah baris tetap; nilai yang sama disiarkan ke semua baris
  • combine():

    • Hanya menyertakan kolom yang dipilih
    • Tidak menyiarkan nilai ke semua baris
Manipulasi Data di Julia

Ayo berlatih!

Manipulasi Data di Julia

Preparing Video For Download...