Yarı yapılandırılmış veriler

Redshift’e Giriş

Jason Myers

Principal Architect

Yarı yapılandırılmış veriler

  • Redshift'in SUPER türünde saklanır
  • Farklı formatlar için özel SQL işlevleri vardır
  • JSON, yarı yapılandırılmış veridir
Redshift’e Giriş

JSON Doğrulama İşlevleri

  • IS_VALID_JSON - bir tüm JSON nesnesinin geçerli olduğunu doğrular
SELECT IS_VALID_JSON('{"one":1, "two":2}');
IS_VALID_JSON
=============
true
SELECT IS_VALID_JSON('{"one":1, "two":2');
IS_VALID_JSON
=============
false
  • IS_VALID_JSON_ARRAY - bir JSON dizisinin geçerli olduğunu doğrular.
SELECT IS_VALID_JSON_ARRAY('{"one":1}')
IS_VALID_JSON_ARRAY
===================
false
SELECT IS_VALID_JSON_ARRAY('[1,2,3]')
IS_VALID_JSON_ARRAY
===================
true
Redshift’e Giriş

Bir JSON nesnesinden çıkarma

  • JSON_EXTRACT_PATH_TEXT bir JSON yolundaki değeri döndürür
  • Bir JSON dizesi ya da alan ve yola giden bir veya daha fazla anahtar alır
SELECT JSON_EXTRACT_PATH_TEXT('{"one":1, "two":2}', 'one');
JSON_EXTRACT_PATH_TEXT
======================
1
Redshift’e Giriş

Geçersiz JSON'u ayrıştırma girişimi

-- Kötü biçimlendirilmiş JSON'dan yol çıkarmaya çalışma
SELECT JSON_EXTRACT_PATH_TEXT('{"one":1, "two":2', 'one');
JSON parsing error
DETAIL:  
  =========================================
  error:  JSON parsing error
  code:      8001
  context:   invalid json object 
  query:     [child_sequence:'one']
  location:  funcs_json.hpp:202
  process:   padbmaster [pid=1073807529]
  =========================================
Redshift’e Giriş

İç içe JSON yollarından çıkarma

  • Birden çok anahtar argümanı verin
SELECT JSON_EXTRACT_PATH_TEXT('
         {
           "one_object":{
              "nested_three": 3, 
              "nested_four":4
           }, 
           "two":2
         }', 
         'one_object', 'nested_three');
JSON_EXTRACT_PATH_TEXT
======================
3
Redshift’e Giriş

Var olmayan iç içe JSON yollarından çıkarma

  • NULL döner
    SELECT JSON_EXTRACT_PATH_TEXT('
           {
             "one_object":{
                "nested_three": 3, 
                "nested_four":4
             }, 
             "two":2
           }', 
           'two', 'nested_five');
    
JSON_EXTRACT_PATH_TEXT
======================
NULL
Redshift’e Giriş

Bir JSON dizisinden çıkarma

  • JSON_EXTRACT_ARRAY_ELEMENT_TEXT dizi indeksindeki değeri döndürür
  • Bir JSON dizesi ya da alan ve sıfırdan başlayan bir tamsayı indeks alır.
SELECT JSON_EXTRACT_ARRAY_ELEMENT_TEXT('[1.1,400,13]', 2);
JSON_EXTRACT_ARRAY_ELEMENT_TEXT
===============================
13
SELECT JSON_EXTRACT_ARRAY_ELEMENT_TEXT('[1.1,400,13]', 3);
JSON_EXTRACT_ARRAY_ELEMENT_TEXT
===============================
NULL
Redshift’e Giriş

İç içe JSON dizisinden çıkarma

SELECT JSON_EXTRACT_ARRAY_ELEMENT_TEXT(
           JSON_EXTRACT_PATH_TEXT('
               {
                 "one":1, 
                 "nested_two":[3,4,5]
               }', 
               -- JSON_EXTRACT_PATH_TEXT ile nested_two değerini çıkarma
               'nested_two'
            ),
            -- JSON_EXTRACT_ARRAY_ELEMENT_TEXT ile dizinin birinci konumundaki öğeyi çıkarma
            1
       );
JSON_EXTRACT_ARRAY_ELEMENT_TEXT
===============================
4
Redshift’e Giriş

İç içe JSON dizisinden çıkarma kısayolu

  • Dizi indeksi bir dize olmalıdır
-- İki anahtar ('nested_two', '1') vererek
-- nested_two anahtarının dizisindeki ikinci öğeyi seçme
SELECT JSON_EXTRACT_PATH_TEXT('
          {
            "one":1, 
            "nested_two":[3,4,5]
          }', 
          'nested_two', '1'
       );
JSON_EXTRACT_PATH_TEXT
======================
4
Redshift’e Giriş

CTE'lerde dönüştürme (casting)

WITH location_details AS (
    SELECT '{
        "location": "Salmon Challis National Forest",
      }'::SUPER::VARCHAR AS data
) 
  • location_details.data olarak erişilebilir
Redshift’e Giriş

Hadi pratik yapalım!

Redshift’e Giriş

Preparing Video For Download...