Memutar data

Manipulasi Data di Julia

Katerina Zahradova

Instructor

Tabel pivot

  • Cara meringkas data
  • Susun ulang kolom dan baris agar data lebih mudah dibaca
Manipulasi Data di Julia

Tabel pivot dengan unstack()

struktur unstack

Manipulasi Data di Julia

unstack() untuk pivot

# Menggunakan unstack untuk pivot
# unstack(DataFrame, :col_as_rows, :col_as_cols, :values, combine = f_to_aggregate)

unstack(penguins, :species, :sex, :body_mass_g, combine = median)
3×3 DataFrame
Row  species   MALE     FEMALE
     String15  Float64  Float64
_____________________________________
1    Adelie    4000.0   3400.0
2    Chinstrap 3950.0   3550.0
3    Gentoo    5500.0   4700.0
Manipulasi Data di Julia

Pivot pada beberapa kolom sebagai baris

# Pivot pada lebih banyak kolom sebagai baris
unstack(penguins, [:species, :island], :sex, :body_mass_g, combine = median)
5×4 DataFrame
Row  species    island     MALE       FEMALE
     String15   String15   Float64?   Float64?
_____________________________________________________
1    Adelie     Torgersen  4000.0    3400.0
2    Adelie     Biscoe     4000.0    3375.0
3    Adelie     Dream      3987.5    3400.0
4    Chinstrap  Dream      3950.0    3550.0
5    Gentoo     Biscoe     5500.0    4700.0
Manipulasi Data di Julia

Pivot pada beberapa kolom di tempat lain

# Menggunakan beberapa kolom sebagai kolom
unstack(penguins, :sex, [:species, :island], :body_mass_g, combine = sum)
MethodError: no method matching 
unstack(::DataFrame, ::Symbol, ::Vector{Symbol}, ::Symbol; combine = sum)
Manipulasi Data di Julia

Nilai hilang

# Nilai hilang untuk kombinasi tertentu
unstack(penguins_missing, :species, :sex, :body_mass_g, combine = median)
3×3 DataFrame
Row  species   MALE     FEMALE
     String15  Float64  Float64?
_____________________________________
1    Adelie    4000.0   3400.0
2    Chinstrap 3950.0   3550.0
3    Gentoo    5500.0   missing
Manipulasi Data di Julia

Mengganti nilai hilang

# Nilai hilang untuk kombinasi tertentu
unstack(penguins_missing, :species, :sex, :body_mass_g, combine = median, fill = -1)
3×3 DataFrame
Row  species   MALE     FEMALE
     String15  Float64  Float64
_____________________________________
1    Adelie    4000.0    3400.0
2    Chinstrap 3950.0    3550.0
3    Gentoo    5500.0    -1
Manipulasi Data di Julia

Tabel pivot adalah DataFrame

# Menyimpan tabel pivot
pivot_penguins = unstack(penguins_missing, :species, :sex, :body_mass_g, combine = median)

# Pilih hanya penguin betina
select(pivot_penguins, :species, :FEMALE)
3×2 DataFrame
Row  species    FEMALE
     String15   Float64?
_______________________________
1    Adelie      3400.0
...
Manipulasi Data di Julia

Ayo berlatih!

Manipulasi Data di Julia

Preparing Video For Download...