Streaming-systemen horizontaal schalen

Streaming-concepten

Mike Metzger

Data Engineer

Opfrisser: horizontaal schalen

  • In plaats van "op" schalen, schakel je "uit"
  • Meestal: meer verwerkers toevoegen, niet snellere/betere
  • Werkt het best bij embarrassingly parallel taken
    • Taken die je makkelijk kunt opsplitsen
    • Bijv. een grote set onafhankelijke afbeeldingen verwerken
Streaming-concepten

Horizontaal schalen met streaming

  • Streamverwerking heeft doorgaans minimale vertraging
  • Dat maakt datatransfer tussen workers lastig
  • Verwerk een volledige stream idealiter in één pipeline
  • Maak kopieën van die pipelines
Streaming-concepten

Pipeline-kopieën

  • Als events binnenkomen, gaan ze eerst een pipeline in
  • Alle taken daarvoor zijn zelfstandig binnen die pipeline tot afronding
  • Schaal door meer pipelines toe te voegen
  • Je kunt binnen een pipeline ook verticaal schalen
Streaming-concepten

Aanvullende aandachtspunten

  • Andere componenten kunnen nodig zijn
  • Load balancer / director
    • Kaartdeler
    • Minst drukke node
  • Uiteindelijk krijg je knelpunten
    • Schrijfsnelheid van schijf
  • Overweeg de streaming-pipeline te verkorten
    • Haal de noodzaak weg om direct te verwerken
Streaming-concepten

Laten we oefenen!

Streaming-concepten

Preparing Video For Download...