Pivot dei dati

Manipolazione dei dati in Julia

Katerina Zahradova

Instructor

Tabelle pivot

  • Modo per riassumere i dati
  • Riorganizza righe e colonne per renderli più leggibili
Manipolazione dei dati in Julia

Pivot con unstack()

struttura di unstack

Manipolazione dei dati in Julia

unstack() per pivotare

# Usare unstack per fare pivot
# unstack(DataFrame, :col_as_rows, :col_as_cols, :values, combine = f_to_aggregate)

unstack(penguins, :species, :sex, :body_mass_g, combine = median)
3×3 DataFrame
Row  species   MALE     FEMALE
     String15  Float64  Float64
_____________________________________
1    Adelie    4000.0   3400.0
2    Chinstrap 3950.0   3550.0
3    Gentoo    5500.0   4700.0
Manipolazione dei dati in Julia

Pivot su più colonne come righe

# Pivot su più colonne come righe 
unstack(penguins, [:species, :island], :sex, :body_mass_g, combine = median)
5×4 DataFrame
Row  species    island     MALE       FEMALE
     String15   String15   Float64?   Float64?
_____________________________________________________
1    Adelie     Torgersen  4000.0    3400.0
2    Adelie     Biscoe     4000.0    3375.0
3    Adelie     Dream      3987.5    3400.0
4    Chinstrap  Dream      3950.0    3550.0
5    Gentoo     Biscoe     5500.0    4700.0
Manipolazione dei dati in Julia

Pivot su più colonne altrove

# Usare più colonne come colonne
unstack(penguins, :sex, [:species, :island], :body_mass_g, combine = sum)
MethodError: no method matching 
unstack(::DataFrame, ::Symbol, ::Vector{Symbol}, ::Symbol; combine = sum)
Manipolazione dei dati in Julia

Valori mancanti

# Valori mancanti per alcune combinazioni
unstack(penguins_missing, :species, :sex, :body_mass_g, combine = median)
3×3 DataFrame
Row  species   MALE     FEMALE
     String15  Float64  Float64?
_____________________________________
1    Adelie    4000.0   3400.0
2    Chinstrap 3950.0   3550.0
3    Gentoo    5500.0   missing
Manipolazione dei dati in Julia

Sostituire i mancanti

# Valori mancanti per alcune combinazioni
unstack(penguins_missing, :species, :sex, :body_mass_g, combine = median, fill = -1)
3×3 DataFrame
Row  species   MALE     FEMALE
     String15  Float64  Float64
_____________________________________
1    Adelie    4000.0    3400.0
2    Chinstrap 3950.0    3550.0
3    Gentoo    5500.0    -1
Manipolazione dei dati in Julia

Le pivot sono DataFrame

# Salvare la pivot
pivot_penguins = unstack(penguins_missing, :species, :sex, :body_mass_g, combine = median)

# Seleziona solo le femmine
select(pivot_penguins, :species, :FEMALE)
3×2 DataFrame
Row  species    FEMALE
     String15   Float64?
_______________________________
1    Adelie      3400.0
...
Manipolazione dei dati in Julia

Ayo berlatih!

Manipolazione dei dati in Julia

Preparing Video For Download...