Menyelami DataFrame

Manipulasi Data di Julia

Katerina Zahradova

Instructor

Garis besar kursus

  • Bekerja dengan kolom
  • Pengelompokan data
  • Statistik ringkas
  • Tabel pivot
  • Memuat dan menyimpan file CSV
  • Visualisasi
  • Menulis kode yang rapi dan terstruktur
Manipulasi Data di Julia

Dataset

Penguin

Upah AS

Cokelat

Pesawat

1 Pexels
Manipulasi Data di Julia

String dan simbol

# Using strings
df[:, "col 1"]

df[:, "col2"]
# Using symbols
df[:, Symbol("col 1")]


df[:, :col2]
Manipulasi Data di Julia

Apa yang hilang

# Using first()
println(first(penguins))
Row    species    island    culmen_l_mm ...
       String15   String15  String7?    ...
____________________________________________
1      Adelie     Torgersen 39.1
# Using describe
describe(penguins)
7x7 DataFrame
Row  variable     ...   nmissing  ...
     Symbol       ...   Int64     ... 
______________________________________
1    species      ...   0         ...       
2    island       ...   0         ...
3    culmen_l_mm  ...   10        ...
4    culmen_d_mm  ...   10        ...
5    flipper_l_mm ...   10        ...
...
Manipulasi Data di Julia

Deskripsikan yang hilang dengan jelas

# Describe
describe(penguins)
Row  variable     mean    min     ...
     Symbol       Nothing Union   ...
________________________________________________
1    species              Adelie        
2    island               Biscoe        
3    culmen_l_mm  32.1    34.7
4    culmen_d_mm  13.1    16    
5    flipper_l_mm 205.4   165
...
# Describe using only some columns
describe(penguins, :nmissing, :eltype)
Row  variable     nmissing    eltype
     Symbol       Int64       DataType
________________________________________________
1    species      0           String15        
2    island       0           String15        
3    culmen_l_mm  10          Float64
4    culmen_d_mm  10          Float64
5    flipper_l_mm 10          Float64
...
Manipulasi Data di Julia

Deskripsikan sesuai kebutuhan

# Using sum

describe(penguins, sum => :total)
7×2 DataFrame
Row  variable     total
     Symbol       Union
________________________________________
1    species    
2    island    
3    culmen_l_mm  15136.6
4    culmen_d_mm  5163.4    
...
Manipulasi Data di Julia

Sintaks DataFrames

Templat transformasi kolom

Manipulasi Data di Julia

Sintaks DataFrames

Templat transformasi kolom

Manipulasi Data di Julia

Ayo berlatih!

Manipulasi Data di Julia

Preparing Video For Download...