Popüler akış sistemleri

Akış Kavramları

Mike Metzger

Data engineer

Akış araçları

  • İhtiyaca göre çeşitli araçlar mevcuttur
  • Tasarımcıların işe en uygun aracı seçmesini sağlar
  • Yaygın sistemler:
    • Celery
    • Kafka
    • Spark Streaming

Celery

Apache Kafka

Spark Streaming

Akış Kavramları

Celery

  • Dağıtık görev kuyruğu / FIFO
  • Öncelikle bir /görev kuyruğu olarak kullanılır
  • Sıklıkla eşzamansız görevler için kullanılır
    • Parola sıfırlama e-postaları gönderme
    • Dijital siparişleri tamamlama
    • Görselleri yeniden boyutlandırma
  • Önemli miktarda mesajın gerçek zamanlı işlenmesini sağlar
  • Yönetim ve ölçekleme (dikey ve yatay) özellikleri sunar

Celery projesi

Akış Kavramları

Apache Kafka

  • Dağıtık olay akışı sistemi
  • Olayları üreticiler ve tüketiciler arasında göndermek için tasarlanmıştır
    • Üreticiler, bir konuda olaylar üretir
    • Konular, belirli biçimdeki iletilerdir
    • Tüketiciler, yeni olayları alır
  • Farklı tüketiciler olayları ihtiyaca göre işler (günlükleme, dönüşüm, iletme vb.)
  • Olayların depolanmasını belirtildiği şekilde yönetir
  • Son derece güçlüdür, ancak kurulumu zordur

Apache Kafka

Akış Kavramları

Kafka uygulamaları

  • Birden çok sistem arasında veri aktarma için idealdir
    • Tek doğruluk kaynağı
    • Değişiklik verisi yakalama
    • Veri yedekleri
    • Veri sistemi taşımaları
Akış Kavramları

Spark Streaming

  • Apache Spark'ın parçasıdır
  • Akış verisini işlemek için tasarlanmıştır
  • Spark'ın Scala, Python, SQL vb. ile işleme yeteneklerini kullanır
  • Büyük veri ve makine öğrenimi senaryolarında faydalıdır
  • Yığından akışa işlemeye kolay geçiş sağlar
  • Olay depolamak/günlüklemek için değil, veriyi işlemek/değiştirmek içindir

Apache Spark

Akış Kavramları

Hadi pratik yapalım!

Akış Kavramları

Preparing Video For Download...