Futures

Parallel programmeren in R

Nabeel Imam

Data Scientist

De veeleisende baas

Een man in pak spreekt in een megafoon.

Parallel programmeren in R

Directe uitvoering

report <- "<important report text>"

task <- { print("Hoi, hier is het rapport.") # Email-tekst report }
"Hoi, hierbij het rapport in de bijlage."
task
"<belangrijke rapporttekst>"
Parallel programmeren in R

Uitgestelde uitvoering

library(future)


task_future <- future({ print("Hoi, hier is het rapport.") report })


Parallel programmeren in R

Uitgestelde uitvoering

print(task_future)
Expression: {
print("Hoi, hier is het rapport.")
report
}

Environment: R_GlobalEnv
Resolved: TRUE
Value: 136 bytes of class "character" ...

 

 

  • De code of het "hoe" van de taak

 

  • De omgeving of context van de taak
  • Klaar? Lijkt van wel!
  • Beschrijving van de uitkomst
Parallel programmeren in R

Uitgestelde uitvoering

value(task_future)
[1] "Hoi, hier is het rapport."
[1] "<belangrijke rapporttekst>"
Parallel programmeren in R

Een team werknemers

Een team werknemers krijgt taken van hun manager.

1 Ontworpen door Freepik
Parallel programmeren in R

Een team werknemers

task1 <- future({
  print("Hoi, hier is het rapport.")
  report
})

task2 <- future({
  run_analysis()
  print("Analyse klaar")
})

task3 <- future({
  book_meeting_rooms()
  print("Vergaderruimtes geboekt!")
})
value(task1) # 10:00 Office Assistant
[1] "Hoi, hier is het rapport."
[1] "<belangrijke rapporttekst>"
value(task3) # 11:00 Office Assistant
"Vergaderruimtes geboekt!"
value(task2) # 15:00 Analist
"Analyse klaar"
Parallel programmeren in R

Voortschrijdend gemiddelde met futures

print(amazon_prices)
 [1] 312.58 307.01 302.24
 [4] 297.50 300.32 301.48
 [7] 297.56 297.48 291.93
[10] 294.00 286.28 292.59
...
ma <- future({moving_average(amazon_prices)})


moving_average <- function (prices) {

  N <- length(prices) - 2
  moving_avgs <- rep(NA, N)

  for (i in 1:N) {
    moving_avgs[i] <- mean(prices[i: (i + 2)])
  }

  return(moving_avgs)
}
Parallel programmeren in R

Voortschrijdend gemiddelde met futures

ggplot() +
  geom_line(aes(x = 1:(length(amazon_prices) - 2),
                y = value(ma))) + # Waarde van futures is hier nodig
  labs(y = "Voortschrijdend gemiddelde (USD)", x = "Dagen")

Een lijngrafiek van het voortschrijdend gemiddelde van de Amazon-koers gedurende één maand.

Parallel programmeren in R

Parallelle futures

print(amazon_list)
$`2015-01`
 [1] 312.58 307.01 302.24
 [4] 297.50 300.32 301.48
 ...
$`2015-02`
 [1] 350.05 360.29 358.38
 [4] 366.00 374.87 371.00
 ...
$`2015-03`
 [1] 380.85 383.95 385.71
 [4] 385.61 385.52 378.40
 ...
...
moving_average <- function (prices) {

  N <- length(prices) - 2
  moving_avgs <- rep(NA, N)

  for (i in 1:N) {
    moving_avgs[i] <- mean(prices[i: (i + 2)])
  }

  return(moving_avgs)
}
Parallel programmeren in R

Parallelle futures

plan(multisession, workers = 4)


ma <- lapply(amazon_list, function (x) { future(moving_average(x)) })
  • Gebruik vier worker-cores in multisession

  • Maak één future-taak per element van amazon_list

    • Futures onder multisession worden parallel uitgevoerd
Parallel programmeren in R

Parallelle futures

value(ma)


plan(sequential)
$`2015-01`
 [1] 307.2767 302.2500 300.0200 299.7667 299.7867 298.8400 295.6567 ...
$`2015-02`
 [1] 356.2400 361.5567 366.4167 370.6233 372.3533 371.1400 372.5067 ...
$`2015-03`
 [1] 383.5033 385.0900 385.6133 383.1767 380.4567 375.4867 372.2933 ...
...
Parallel programmeren in R

Waarom future?

Sequentieel

plan(sequential)

ma <- lapply(amazon_list,
             function (x) {
               future(moving_average(x))
               })

value(ls)

Parallel

plan(multisession, workers = 4)

ls <- lapply(amazon_list,
             function (x) {
               future(moving_average(x))
               })

value(ls)

plan(sequential)
Parallel programmeren in R

Laten we oefenen!

Parallel programmeren in R

Preparing Video For Download...