Esplorare i DataFrame

Manipolazione dei dati in Julia

Katerina Zahradova

Instructor

Programma del corso

  • Lavorare con le colonne
  • Raggruppare i dati
  • Statistiche di riepilogo
  • Tabelle pivot
  • Caricare e salvare file CSV
  • Visualizzazioni
  • Scrivere codice chiaro e ordinato
Manipolazione dei dati in Julia

Dataset

Pinguini

Salari USA

Cioccolato

aereo

1 Pexels
Manipolazione dei dati in Julia

Stringhe e simboli

# Usare stringhe
df[:, "col 1"]

df[:, "col2"]
# Usare simboli
df[:, Symbol("col 1")]


df[:, :col2]
Manipolazione dei dati in Julia

Cosa manca

# Usare first()
println(first(penguins))
Row    species    island    culmen_l_mm ...
       String15   String15  String7?    ...
____________________________________________
1      Adelie     Torgersen 39.1
# Usare describe
describe(penguins)
7x7 DataFrame
Row  variable     ...   nmissing  ...
     Symbol       ...   Int64     ... 
______________________________________
1    species      ...   0         ...       
2    island       ...   0         ...
3    culmen_l_mm  ...   10        ...
4    culmen_d_mm  ...   10        ...
5    flipper_l_mm ...   10        ...
...
Manipolazione dei dati in Julia

Descrivilo meglio

# Describe
describe(penguins)
Row  variable     mean    min     ...
     Symbol       Nothing Union   ...
________________________________________________
1    species              Adelie        
2    island               Biscoe        
3    culmen_l_mm  32.1    34.7
4    culmen_d_mm  13.1    16    
5    flipper_l_mm 205.4   165
...
# Describe su alcune colonne
describe(penguins, :nmissing, :eltype)
Row  variable     nmissing    eltype
     Symbol       Int64       DataType
________________________________________________
1    species      0           String15        
2    island       0           String15        
3    culmen_l_mm  10          Float64
4    culmen_d_mm  10          Float64
5    flipper_l_mm 10          Float64
...
Manipolazione dei dati in Julia

Descrivilo come preferisci

# Usare sum

describe(penguins, sum => :total)
7×2 DataFrame
Row  variable     total
     Symbol       Union
________________________________________
1    species    
2    island    
3    culmen_l_mm  15136.6
4    culmen_d_mm  5163.4    
...
Manipolazione dei dati in Julia

Sintassi di DataFrames

Modello trasformazione colonne

Manipolazione dei dati in Julia

Sintassi di DataFrames

Modello trasformazione colonne

Manipolazione dei dati in Julia

Passiamo alla pratica !

Manipolazione dei dati in Julia

Preparing Video For Download...