Data-engineering in Microsoft Fabric
Gegevens transformeren en analyseren met Microsoft Fabric
Luis Silva
Solution Architect - Data & AI
End-to-end data-analyse
Neem data op uit de bron en sla op in een datalake
Bereid en transformeer de data
Visualiseer en analyseer de data
Data Factory
Neem data op, bereid en transformeer
Dataflows en Data Pipelines
Dataflows
Low-code interface voor data-inname en transformatie
Power Query-transformatie-engine
Data Pipelines
Verzameling activiteiten die een taak uitvoeren
Typen activiteiten:
Databeweging (Copy-activiteit, Dataflow)
Datatransformatie (Notebook, Stored Procedure, Script)
Besturing (Switch, If, ForEach, Wait)
Synapse Data Engineering
Lakehouses
Notebooks
Apache Spark Job-definities
Lakehouses
Gestructureerde data (tabellen)
Ongestructureerde data (bestanden)
Notebooks
Interactieve webinterface
Code voor datamanipulatie
Datavisualisaties
Commentaar / uitleg
Meertalige ondersteuning:
PySpark (Python)
Spark (Scala)
Spark SQL (SQL)
SparkR (R)
Apache Spark Job-definities
Dien batch-/streamingjobs in bij Spark-clusters
Alternatief of aanvulling op Notebooks:
Notebooks voor verkenning, prototyping en samenwerken
Spark Job Definition voor automatisering van productieklare verwerkingscode
Synapse Data Warehouse
Werkt als een traditioneel relationeel datawarehouse
Slaat data op in OneLake met het open Delta Lake-formaat
Maakt interoperabiliteit met andere Fabric-workloads mogelijk
Geen meerdere kopieën van data nodig
Een datastore kiezen
Lakehouse
Ongestructureerde data (bestanden)
Spark als primaire ontwikkelinterface
Warehouse
Gestructureerde data (tabellen)
T-SQL als primaire ontwikkelinterface
Een tool voor datakopie kiezen
Een tool voor datakopie kiezen
Een tool voor datakopie kiezen
Laten we oefenen!
Gegevens transformeren en analyseren met Microsoft Fabric
Preparing Video For Download...