Data engineering in Microsoft Fabric
Trasforma e analizza i dati con Microsoft Fabric
Luis Silva
Solution Architect - Data & AI
Data analytics end-to-end
Acquisisci dati dalla fonte e salvali in un data lake
Prepara e trasforma i dati
Visualizza e analizza i dati
Data Factory
Acquisisci, prepara e trasforma i dati
Dataflows e Data Pipelines
Dataflow
Interfaccia low-code per ingestione e trasformazione dati
Motore di trasformazione Power Query
Data Pipelines
Insieme di attività che eseguono un'attività
Tipi di attività:
Movimento dati (Copy activity, Dataflow)
Trasformazione dati (Notebook, Stored Procedure, Script)
Controllo (Switch, If, ForEach, Wait)
Synapse Data Engineering
Lakehouse
Notebook
Definizioni di job Apache Spark
Lakehouse
Dati strutturati (tabelle)
Dati non strutturati (file)
Notebook
Interfaccia web interattiva
Codice per manipolare dati
Visualizzazioni dei dati
Commenti / spiegazioni
Supporto multi-lingua:
PySpark (Python)
Spark (Scala)
Spark SQL (SQL)
SparkR (R)
Definizioni di job Apache Spark
Invia job batch/streaming ai cluster Spark
Alternativa o complemento ai Notebook:
Notebook per esplorazione dati, prototipazione e sviluppo collaborativo
Spark Job Definition per automatizzare codice di data processing pronto per la produzione
Synapse Data Warehouse
Si comporta come un tradizionale data warehouse relazionale
Archivia i dati in OneLake con formato aperto Delta Lake
Abilita interoperabilità con altri carichi di lavoro Fabric
Niente copie multiple dei dati
Scegliere un data store
Lakehouse
Dati non strutturati (file)
Spark come interfaccia di sviluppo principale
Warehouse
Dati strutturati (tabelle)
T-SQL come interfaccia di sviluppo principale
Scegliere uno strumento di copia dati
Scegliere uno strumento di copia dati
Scegliere uno strumento di copia dati
Ayo berlatih!
Trasforma e analizza i dati con Microsoft Fabric
Preparing Video For Download...