Unire e fare join dei dati

Trasforma e analizza i dati con Microsoft Fabric

Luis Silva

Solution Architect - Data & AI

Strumenti per unire dati

 

 

Icone di tre strumenti: SQL, Spark e Dataflows

Trasforma e analizza i dati con Microsoft Fabric

Basi dell'unione dei dati

  • Unisci tabelle su colonne in comune.
  • Utile per creare schemi a stella.
  • Operazione base: JOIN tra due tabelle (sinistra e destra).
Trasforma e analizza i dati con Microsoft Fabric

Basi dell'unione dei dati

  • Unisci tabelle su colonne in comune.
  • Utile per creare schemi a stella.
  • Operazione base: JOIN tra due tabelle (sinistra e destra).

Diagramma che illustra l'unione di due tabelle

Trasforma e analizza i dati con Microsoft Fabric

Tipi di join

  • INNER JOIN: restituisce i record con valori corrispondenti in entrambe le tabelle.

Diagramma di due tabelle, sinistra e destra, con evidenziata l'intersezione come risultato dell'inner join

Trasforma e analizza i dati con Microsoft Fabric

Tipi di join

  • INNER JOIN: restituisce i record con valori corrispondenti in entrambe le tabelle.
  • LEFT OUTER JOIN: restituisce tutti i record della tabella a sinistra e quelli corrispondenti della tabella a destra.

Diagramma di due tabelle, sinistra e destra, con evidenziati la tabella sinistra e l'intersezione come risultato del left outer join

Trasforma e analizza i dati con Microsoft Fabric

Tipi di join

  • INNER JOIN: restituisce i record con valori corrispondenti in entrambe le tabelle.
  • LEFT OUTER JOIN: restituisce tutti i record della tabella a sinistra e quelli corrispondenti della tabella a destra.
  • RIGHT OUTER JOIN: restituisce tutti i record della tabella a destra e quelli corrispondenti della tabella a sinistra.

Diagramma di due tabelle, sinistra e destra, con evidenziati la tabella destra e l'intersezione come risultato del right outer join

Trasforma e analizza i dati con Microsoft Fabric

Tipi di join

  • INNER JOIN: restituisce i record con valori corrispondenti in entrambe le tabelle.
  • LEFT OUTER JOIN: restituisce tutti i record della tabella a sinistra e quelli corrispondenti della tabella a destra.
  • RIGHT OUTER JOIN: restituisce tutti i record della tabella a destra e quelli corrispondenti della tabella a sinistra.
  • FULL OUTER JOIN: restituisce tutti i record quando c'è corrispondenza nella tabella sinistra o destra.

Diagramma di due tabelle, sinistra e destra, con evidenziata l'unione come risultato del full outer join

Trasforma e analizza i dati con Microsoft Fabric

Unire tabelle con SQL

  • Istruzione JOIN
  • Sintassi:
    SELECT 
      <columns> 
      ... 
    FROM <Left_Table>
    INNER | LEFT | RIGHT | FULL JOIN <Right_Table> 
      ON <Left_Table>.<Join_Column> = <Right_Table>.<Join_Column>;
    
Trasforma e analizza i dati con Microsoft Fabric

Unire tabelle con PySpark

  • Funzione join()
  • Sintassi:
    <df_left>.join(
      <df_right,
      [<df_left>.<join_column> == <df_right>.<join_column>],
      how='inner' | 'left' | 'right | 'outer'
    )
    
Trasforma e analizza i dati con Microsoft Fabric

Unire tabelle con Dataflows

  • Unisci query
  • Unisci query come nuove

Schermata che mostra la finestra Merqe queries in un Dataflow

Trasforma e analizza i dati con Microsoft Fabric

Passons à la pratique !

Trasforma e analizza i dati con Microsoft Fabric

Preparing Video For Download...