Appiattire dati semi-strutturati

Tipi di dati e funzioni in Snowflake

Jake Roach

Field Data Engineer

Dati strutturati

     school_id  |    school_name    |  street_number  |  street_name  |  suffix   |      city      |  zip_code
    ----------- | ----------------- | --------------- | ------------- | --------- | -------------- | ----------
      s_19219   |  West Aurora HS   |       879       |    Main       |    St.    |  West Aurora   |   25041
      s_77465   |  Springtown HS    |      1645       |    Cherry     |    Rd.    |  Springtown    |   14556
     school_id  |                address_info        
    ----------- | ------------------------------------------
      s_19219   |    {
                |        "school_name": "West Aurora HS",
                |        "address": {
                |            "street_number": 879,
                |            "street_name": "Main",
                |            "suffix":  "St."
                |            "city": "West Aurora",
                |            "zip_code": 25041
                |        }
                |    }
Tipi di dati e funzioni in Snowflake

Dati semi-strutturati

I dati con parentesi graffe in coppie chiave-valore hanno tipo VARIANT

{
    "school_name": "West Aurora HS",
    "address": {  -- Oggetto annidato
        "street_number": 879,
        "street_name": "Main",
        "suffix": "St.",
        "city": "West Aurora",
        "zip_code": 25041
    }
}

$$

$$

$$

  • Come un dizionario Python o un oggetto JSON
  • Consente di salvare dati in formato "grezzo"
  • Puoi annidare oggetti, come address
  • Due modi per recuperare i dati
Tipi di dati e funzioni in Snowflake

Notazione con punto

                  my_column  
 -------------------------------------------
        {
            "my_first_key": 2025,
            "my_second_key": {
                "a": "alpha",
                "b": "bravo"
            }
        }
SELECT

my_column:my_first_key -- Top-level
my_column:my_second_key.a -- Annidato my_column:my_second_key.b -- Annidato
...

Rende facile recuperare valori top-level e annidati dai dati VARIANT

$$

  • I due punti separano <column-name>:<top-level-key>
  • Aggiungi . e il campo annidato, <column-name>:<top-level-key>.<nested-key>
  • Recupera valori anche molto annidati
Tipi di dati e funzioni in Snowflake

Notazione con punto

SELECT
    address_info:school_name,                              -- Top-level, notazione con punto

    address_info:address.street_number AS street_number,   -- Annidato, notazione con punto
    address_info:address.street_name AS street_name,
    address_info:address.suffix AS suffix

FROM SCHOOLS.school_info;
              school_name    |  street_number  |  street_name  |  suffix  
           ----------------- | --------------- | ------------- | ---------
            West Aurora HS   |       879       |    Main       |    St.   
            Springtown HS    |      1645       |    Cherry     |    Rd.
Tipi di dati e funzioni in Snowflake

Notazione con parentesi

Offre un altro modo per recuperare valori al top-level e annidati

$$

  • <column-name>['<top-level-key']['...']
  • Molti livelli annidati
  • Come accedere a un dizionario Python
  • Usa le virgolette singole (')!
                    my_column  
 ------------------------------------------------
          {
              "my_first_key": 2025,
               my_second_key": {
                  "a": "alpha",
                  "b": "bravo"
              }
          }
SELECT

my_column['my_first_key'], -- Top-level
my_column['my_second_key']['a'] -- Annidato my_column['my_second_key']['b'] -- Annidato
...
Tipi di dati e funzioni in Snowflake

Notazione con parentesi

SELECT

address_info['school_name'], -- Top-level, notazione con parentesi
address_info['address']['city'] AS city, -- Annidato, notazione con parentesi address_info['address']['zip_code'] AS zip_code
FROM SCHOOLS.school_info;
                     school_name    |      city      |  zip_code
                  ----------------- | -------------- | ----------
                   West Aurora HS   |  West Aurora   |   25041
                   Springtown HS    |  Springtown    |   14556
Tipi di dati e funzioni in Snowflake

Trasformare dati semi-strutturati

SELECT
    school_id,

    address_info:school_name AS school_name,               -- Top-level, dot-notation

    address_info:address.street_number AS street_number,   -- Annidato, dot-notation
    address_info:address.street_name AS street_name,
    address_info:address.suffix AS suffix,

    address_info['address']['city'] AS city,               -- Annidato, notazione con parentesi
    address_info['address']['zip_code'] AS zip_code

FROM SCHOOLS.school_info;
Tipi di dati e funzioni in Snowflake

Trasformare dati semi-strutturati

     school_id  |                address_info        
    ----------- | ------------------------------------------
      s_19219   |    {
                |        "school_name": "West Aurora HS",
                |        "address": {
                |            "street_number": 879,
                |            "street_name": "Main",
                |            "suffix":  "St."
                |            "city": "West Aurora",
                |            "zip_code": 25041
                |        }
                |    }
     school_id  |    school_name    |  street_number  |  street_name  |  suffix   |      city      |  zip_code
    ----------- | ----------------- | --------------- | ------------- | --------- | -------------- | ----------
      s_19219   |  West Aurora HS   |       879       |    Main       |    St.    |  West Aurora   |   25041
      s_77465   |  Springtown HS    |      1645       |    Cherry     |    Rd.    |  Springtown    |   14556
Tipi di dati e funzioni in Snowflake

Ayo berlatih!

Tipi di dati e funzioni in Snowflake

Preparing Video For Download...