Gestire i valori mancanti

Caso di studio: analisi di serie temporali cittadine in R

Lore Dirick

Manager of Data Science Curriculum at Flatiron School

Valori mancanti

citydata
              pop
1980-01-01 562994
1981-01-01 564179
1982-01-01 565361
1983-01-01 565491
1984-01-01 566723
1985-01-01     NA
1986-01-01     NA
1987-01-01     NA
1988-01-01 570867
1989-01-01 572222
1990-01-01 574823

serie temporale con dati mancanti

Caso di studio: analisi di serie temporali cittadine in R

Riempi NA con l'ultima osservazione

  • Last observation carried forward (LOCF)
citydata_locf <- na.locf(citydata)

plot.xts(citydata)
plot.xts(citydata_locf)

serie temporale con mancanti riempiti con l'ultima osservazione (LOCF)

Caso di studio: analisi di serie temporali cittadine in R

Riempi NA con la prossima osservazione

  • Next observation carried backward (NOCB)
citydata_nocb <- na.locf(citydata, fromLast = TRUE)

plot.xts(citydata)
plot.xts(citydata_nocb)

serie temporale con mancanti riempiti con la prossima osservazione (NOCB)

Caso di studio: analisi di serie temporali cittadine in R

Interpolazione lineare

citydata_approx <- na.approx(citydata)

plot.xts(citydata)
plot.xts(citydata_nocb)

serie temporale con mancanti riempiti con interpolazione lineare

Caso di studio: analisi di serie temporali cittadine in R

Passiamo alla pratica!

Caso di studio: analisi di serie temporali cittadine in R

Preparing Video For Download...