Ingestione dei dati

Comprendere la data architecture moderna

Miller Trujillo

Senior Software Engineer

Cos’è l’ingestione dei dati?

  • Requisiti funzionali
  • La funzione può essere influenzata dall’analisi

Architettura Big Data generica con sorgenti dati, ingestion, storage, processing, orchestrazione, governance, serving e storage/reporting analitico

Comprendere la data architecture moderna

Ingestion batch

  • Pianificata per acquisire dati periodicamente
  • Copia sulla piattaforma per l’analisi
  • Leggere tutto vs solo le novità
  • Dataset grandi richiedono letture parziali
  • I dataset piccoli si possono sovrascrivere
Comprendere la data architecture moderna

Ingestion batch: porta solo ciò che è cambiato

  • Risorse infinite: impossibili
  • Ingerisci solo ciò che è cambiato
  • Timestamp di aggiornamento o flag
  • Stato più recente dei dati
  • Le eliminazioni richiedono un flag o consolidamento
Comprendere la data architecture moderna

Ingestion in streaming

  • Modello push
  • Code di eventi
  • Calcolo 24/7
  • Zona di atterraggio

Flusso di lavoro dell’ingestion in streaming

Comprendere la data architecture moderna

Esercitiamoci!

Comprendere la data architecture moderna

Preparing Video For Download...