data.table: fread

Introductie tot het importeren van data in R

Filip Schouwenaars

Instructor, DataCamp

data.table

  • Matt Dowle & Arun Srinivasan

  • Belangrijkste metric: snelheid

  • Datamanipulatie in R

  • Data importeren met: fread()

install.packages("data.table")
library(data.table)
  • Lijkt op read.table()
Introductie tot het importeren van data in R

fread()

states.csv

state,capital,pop_mill,area_sqm
South Dakota,Pierre,0.853,77116
New York,Albany,19.746,54555
Oregon,Salem,3.970,98381
Vermont,Montpelier,0.627,9616
Hawaii,Honolulu,1.420,10931
states2.csv

South Dakota,Pierre,0.853,77116
New York,Albany,19.746,54555
Oregon,Salem,3.970,98381
Vermont,Montpelier,0.627,9616
Hawaii,Honolulu,1.420,10931
Introductie tot het importeren van data in R

fread()

fread("states.csv")
          state    capital pop_mill area_sqm
1: South Dakota     Pierre    0.853    77116
2:     New York     Albany   19.746    54555
3:       Oregon      Salem    3.970    98381
4:      Vermont Montpelier    0.627     9616
5:       Hawaii   Honolulu    1.420    10931
fread("states2.csv")
             V1         V2     V3    V4
1: South Dakota     Pierre  0.853 77116
2:     New York     Albany 19.746 54555
3:       Oregon      Salem  3.970 98381
4:      Vermont Montpelier  0.627  9616
5:       Hawaii   Honolulu  1.420 10931
Introductie tot het importeren van data in R

fread()

  • Herkent kolomtypes en scheidingstekens

  • Werkt gewoon

  • Buitengewoon snel

  • Veel parameters instelbaar

  • Verbeterde read.table()

  • Snel, handig, aanpasbaar

Introductie tot het importeren van data in R

Laten we oefenen!

Introductie tot het importeren van data in R

Preparing Video For Download...