Gegevens samenvoegen

Gegevens transformeren en analyseren met Microsoft Fabric

Luis Silva

Solution Architect - Data & AI

Tools voor samenvoegen van data

 

 

Pictogrammen van drie tools: SQL, Spark en Dataflows

Gegevens transformeren en analyseren met Microsoft Fabric

Basis van data samenvoegen

  • Join tabellen op gemeenschappelijke kolommen.
  • Handig bij het bouwen van ster-schema's.
  • Kernbewerking: JOIN tussen twee tabellen (links en rechts).
Gegevens transformeren en analyseren met Microsoft Fabric

Basis van data samenvoegen

  • Join tabellen op gemeenschappelijke kolommen.
  • Handig bij het bouwen van ster-schema's.
  • Kernbewerking: JOIN tussen twee tabellen (links en rechts).

Diagram dat het samenvoegen van twee tabellen illustreert

Gegevens transformeren en analyseren met Microsoft Fabric

Join-typen

  • INNER JOIN: Retourneert rijen met overeenkomende waarden in beide tabellen.

Diagram van twee tabellen, links en rechts, met de overlap gemarkeerd als resultaat van de inner join

Gegevens transformeren en analyseren met Microsoft Fabric

Join-typen

  • INNER JOIN: Retourneert rijen met overeenkomende waarden in beide tabellen.
  • LEFT OUTER JOIN: Retourneert alle rijen uit de linkertabel en de overeenkomende rijen uit de rechtertabel.

Diagram van twee tabellen, links en rechts, met de linkertabel en de overlap gemarkeerd als resultaat van left outer join

Gegevens transformeren en analyseren met Microsoft Fabric

Join-typen

  • INNER JOIN: Retourneert rijen met overeenkomende waarden in beide tabellen.
  • LEFT OUTER JOIN: Retourneert alle rijen uit de linkertabel en de overeenkomende rijen uit de rechtertabel.
  • RIGHT OUTER JOIN: Retourneert alle rijen uit de rechtertabel en de overeenkomende rijen uit de linkertabel.

Diagram van twee tabellen, links en rechts, met de rechtertabel en de overlap gemarkeerd als resultaat van right outer join

Gegevens transformeren en analyseren met Microsoft Fabric

Join-typen

  • INNER JOIN: Retourneert rijen met overeenkomende waarden in beide tabellen.
  • LEFT OUTER JOIN: Retourneert alle rijen uit de linkertabel en de overeenkomende rijen uit de rechtertabel.
  • RIGHT OUTER JOIN: Retourneert alle rijen uit de rechtertabel en de overeenkomende rijen uit de linkertabel.
  • FULL OUTER JOIN: Retourneert alle rijen met een match in linker- of rechtertabel.

Diagram van twee tabellen, links en rechts, met de unie gemarkeerd als resultaat van full outer join

Gegevens transformeren en analyseren met Microsoft Fabric

Tabellen samenvoegen met SQL

  • JOIN-statement
  • Syntax:
    SELECT 
      <columns> 
      ... 
    FROM <Left_Table>
    INNER | LEFT | RIGHT | FULL JOIN <Right_Table> 
      ON <Left_Table>.<Join_Column> = <Right_Table>.<Join_Column>;
    
Gegevens transformeren en analyseren met Microsoft Fabric

Tabellen samenvoegen met PySpark

  • join()-functie
  • Syntax:
    <df_left>.join(
      <df_right,
      [<df_left>.<join_column> == <df_right>.<join_column>],
      how='inner' | 'left' | 'right | 'outer'
    )
    
Gegevens transformeren en analyseren met Microsoft Fabric

Tabellen samenvoegen met Dataflows

  • Queries samenvoegen
  • Queries samenvoegen als nieuw

Schermafbeelding van het dialoogvenster Merge queries in een Dataflow

Gegevens transformeren en analyseren met Microsoft Fabric

Laten we oefenen!

Gegevens transformeren en analyseren met Microsoft Fabric

Preparing Video For Download...