Servicemodi

MLOps-deployments en levenscyclus

Nemanja Radojkovic

Senior Machine Learning Engineer

model als software

MLOps-deployments en levenscyclus

gebruikersperspectief

MLOps-deployments en levenscyclus

service als elke andere

MLOps-deployments en levenscyclus

voedselservice

MLOps-deployments en levenscyclus

modelservice

MLOps-deployments en levenscyclus

Serving en servingmodus

  • Voorspellingen aanbieden == model serving
  • Implementatie van een specifiek type serving == servingmodus

 

Kies zorgvuldig!

MLOps-deployments en levenscyclus

wanneer moet de service draaien

MLOps-deployments en levenscyclus

gepland

MLOps-deployments en levenscyclus

op aanvraag

MLOps-deployments en levenscyclus

batchvoorspelling 1

MLOps-deployments en levenscyclus

batchvoorspelling 2

MLOps-deployments en levenscyclus

batchdefinitie

MLOps-deployments en levenscyclus

ook bekend als

MLOps-deployments en levenscyclus

Batchvoorspelling: houd het simpel

  • Batchvoorspelling is het simpelst
  • Kan het voor je usecase? Doe het dan
  • Goed voorbeeld: maandelijks verkoopprognoses genereren
MLOps-deployments en levenscyclus

on-demand 1

MLOps-deployments en levenscyclus

on-demand synoniemen

MLOps-deployments en levenscyclus

on-demand tijd cruciaal

MLOps-deployments en levenscyclus

technische term

MLOps-deployments en levenscyclus

aanvraagtijd

MLOps-deployments en levenscyclus

responstijd

MLOps-deployments en levenscyclus

Acceptabele latency

Wat is acceptabel?

  • < 1 uur?
  • < 1 minuut?
  • < 1 seconde?
  • < 1 milliseconde?
MLOps-deployments en levenscyclus

Near‑realtime voorspelling, aka stream processing

Acceptabele latency ~= X minuten

Ook wel stream processing genoemd (requests en responses vormen „datastromen”)

MLOps-deployments en levenscyclus

Realtime voorspelling

Acceptabele latency < 1 sec

Voorbeeld:

  • Creditcardfraude-detectie
  • Te late voorspelling is vrijwel nutteloos
MLOps-deployments en levenscyclus

Als latency prioriteit heeft

  • Zwakker maar sneller model kan waardevoller zijn dan een sterker maar trager model
  • Modellen op eindapparaten om latency te verlagen => „edge‑deployment”
    • ML‑apps op smartphones:
      • navigatieapps
      • ontgrendelen met gezichtsherkenning
      • afbeeldingsfilters
MLOps-deployments en levenscyclus

Laten we oefenen!

MLOps-deployments en levenscyclus

Preparing Video For Download...