Toplu işlemeyi ölçekleme

Akış Kavramları

Mike Metzger

Data Engineer

Ölçekleme nedir?

  • Performansı artırma
    • Daha hızlı işleme
      • Aynı miktarda veriyi işlemek için daha az süre
    • Daha fazla veri işleme
      • Aynı sürede daha fazla veri işlenir
Akış Kavramları

Dikey ölçekleme

  • Daha iyi donanım
    • Daha hızlı CPU
    • Daha hızlı G/Ç
    • Daha fazla bellek
  • Genellikle en kolay ölçekleme türüdür
    • En az karmaşıklık
    • Altyapı programlarını/algoritmaları nadiren değiştirmeyi gerektirir

CPU

Bellek

1 Görseller: https://unsplash.com/@jeremy0
Akış Kavramları

Dikey ölçeklemenin eksileri

  • Doğası gereği sınırlıdır
  • Pahalı olabilir / düşük YG
  • Endüstri iyileştirmeleri garantili değildir
Akış Kavramları

Yatay ölçekleme

  • Bir görevi birden çok parçaya bölme
    • Daha fazla bilgisayar
    • Daha fazla CPU da olabilir
  • En iyi, "utandırıcı derecede paralel" görevlerde
    • Kolayca çalışanlara bölünebilen görevler
  • Çok maliyet etkin olabilir
  • Bazı süreçlerde neredeyse doğrusal performans artışı sağlar

CPU1

CPU2

CPU3

CPU4

Akış Kavramları

Yatay ölçeklemenin eksileri

  • Karmaşıklık
    • Bir işleme çerçevesi gerekir (Apache Spark veya Dask gibi)
    • Daha kapsamlı ağ gerekir
  • Sürekli yönetim
  • Gereksinimlere bağlı olarak pahalı olabilir
  • "Paralel olmayan" görevler
Akış Kavramları

Hadi pratik yapalım!

Akış Kavramları

Preparing Video For Download...