Akış verisi vaka çalışması
AWS Kinesis ve Lambda ile Akış Verileri
Maksim Pecherskiy
Data Engineer
Bu bölüm
Gelen veriyi Firehose'a gönderin
Veriyi depolayın
Veriyi görselleştirin
Gerçek zamanlı uyarılar ayarlayın
Akışı izleyin
Bir gereksinim setini karşılayın
Gereksinimler
Tweet'lerde #sandiego etiketi olmalı
Tweet'ler gerçek zamanlı gelmeli
Tweet'ler duygu analizi ile zenginleştirilmeli
Son 15 dakikalık veriyi görselleştir
5 dakikada >3 olumsuz tweet olursa yöneticiye bildir
Akış, kesintilerden kaynaklı veri kaybını en aza indirmeli
Veri, sonra analiz için kalıcı olmalı
Tweet'ler gerçek zamanlı gelir
Duygu analiziyle zenginleştirilmiş
Veri daha sonra analiz için kalıcı olmalı
Son 15 dakikayı görselleştir
Redshift ve Elasticsearch
Redshift
Temiz veri tablolarını depolamak için tasarlanmıştır
Şema veritabanında tanımlıdır
Sorgular için SQL
Tableau gibi BI araçlarıyla çok iyi çalışır
Elasticsearch
Şemasız - günlükler ve metin için iyi
Şema sorgu sırasında oluşturulur
Sorgular için kendi dilini kullanır
Kendi arayüzü vardır - Kibana
Hadi pratik yapalım!
AWS Kinesis ve Lambda ile Akış Verileri
Preparing Video For Download...