Uso avanzato di Jinja con dbt

Case Study: creazione di modelli di dati E‑Commerce con dbt

Susan Sun

Freelance Data Scientist

Istruzione Jinja: loop

Le istruzioni Jinja sono racchiuse in {% %}:

  • Iterare su elementi
    • Template:
      {% for ... %} ... {% endfor %}
      
    • Esempio:
      {% for order_status in order_statuses %}
        SUM(
            CASE WHEN status = '{{ order_status }}' 
              THEN order_id 
            END)
      {% endfor %}
      
Case Study: creazione di modelli di dati E‑Commerce con dbt

Istruzione Jinja: loop

SQL ripetitivo:

SELECT 
    user_id,
    SUM(CASE WHEN status = 'Shipped' THEN 1 ELSE 0 END) 
        AS num_orders_Shipped,
    SUM(CASE WHEN status = 'Complete' THEN 1 ELSE 0 END) 
        AS num_orders_Complete,
    SUM(CASE WHEN status = 'Processing' THEN 1 ELSE 0 END) 
        AS num_orders_Processing,        
FROM {{ ref('stg_looker__orders') }}
GROUP BY 1
Case Study: creazione di modelli di dati E‑Commerce con dbt

Istruzione Jinja: loop

{% set order_statuses = ['Shipped', 'Complete', 'Processing'] %}

SELECT 
    user_id,
    -- Jinja loop
    {% for order_status in order_statuses %}
        SUM(CASE WHEN status = '{{ order_status }}' THEN 1 ELSE 0 END) 
        -- Nome colonna parametrizzato
        AS num_orders_{{ order_status }}
    {% endfor %}
FROM {{ ref('stg_looker__orders') }}
GROUP BY 1
Case Study: creazione di modelli di dati E‑Commerce con dbt

Istruzione Jinja: loop

Output di dbt compile:

SELECT 
    user_id,
    SUM(CASE WHEN status = 'Shipped' THEN 1 ELSE 0 END) 
        AS num_orders_Shipped,
    SUM(CASE WHEN status = 'Complete' THEN 1 ELSE 0 END) 
        AS num_orders_Complete,
    SUM(CASE WHEN status = 'Processing' THEN 1 ELSE 0 END) 
        AS num_orders_Processing,        
FROM "dbt"."main"."stg_looker__orders"
GROUP BY 1
Case Study: creazione di modelli di dati E‑Commerce con dbt

Istruzione Jinja: macro

Una macro Jinja:

  • È una funzione, scritta in Jinja
  • È riutilizzabile
  • È salvata nella cartella /macros

COALESCE():

  • restituisce il primo valore non null
  • sintassi: COALESCE(value1, value2, ...)
  • es.: COALESCE(nickname, first_name)

Esempio di funzione macro:

Uno screenshot dell'IDE con il file `coalesce_and_round.sql` aperto nell'editor che mostra la logica della macro.

Case Study: creazione di modelli di dati E‑Commerce con dbt

Istruzione Jinja: macro

Le istruzioni Jinja sono racchiuse in {% %}:

  • Una funzione macro riutilizzabile:
    • Template:
      {% macro ... %} ... {% endmacro %}
      
    • Esempio:
      {% macro coalesce_and_round(column_name, decimal_places = 2) %}
            ROUND(COALESCE({{ column_name }}, 0), {{ decimal_places }})
      {% endmacro %}
      
Case Study: creazione di modelli di dati E‑Commerce con dbt

Istruzione Jinja: macro

  • SQL ripetitivo
    ROUND(COALESCE(sales_amount, 0), 2) AS sales_amount,
    ROUND(COALESCE(cost_of_goods_sold, 0), 2) AS cost_of_goods_sold,
    
  • DRY (Don't Repeat Yourself)
    • Crea la macro coalesce_and_round.sql
    • Salvala in /macros
    • Invoca:
      {{ coalesce_and_round('sales_amount', 2) }} AS sales_amount,
      {{ coalesce_and_round('cost_of_goods_sold', 2) }} AS cost_of_goods_sold,
      
Case Study: creazione di modelli di dati E‑Commerce con dbt

Gestire gli spazi bianchi in Jinja

Come scritto:

{% set traffic_source_values = ['Adwords', 'Email', 'Facebook'] %}
{% set browser_values = ['Chrome', 'Firefox', 'Safari', 'IE', 'Other'] %}

SELECT 
    user_id,
    COUNT(DISTINCT session_id) AS num_web_sessions,
...
Case Study: creazione di modelli di dati E‑Commerce con dbt

Gestire gli spazi bianchi in Jinja

Compilato:




SELECT 
    user_id,
    COUNT(DISTINCT session_id) AS num_web_sessions,
... 
Case Study: creazione di modelli di dati E‑Commerce con dbt

Gestire gli spazi bianchi in Jinja

  • {%- ... %} rimuove lo spazio bianco prima.
  • {% ... -%} rimuove lo spazio bianco dopo.
  • {%- ... -%} rimuove entrambi.

  • Esempio:

{%- set traffic_source_values = ['Adwords', 'Email', 'Facebook'] -%}
{%- set browser_values = ['Chrome', 'Firefox', 'Safari', 'IE', 'Other'] -%}

SELECT 
    user_id,
    COUNT(DISTINCT session_id) AS num_web_sessions,
...
Case Study: creazione di modelli di dati E‑Commerce con dbt

Ayo berlatih!

Case Study: creazione di modelli di dati E‑Commerce con dbt

Preparing Video For Download...