Membuat deskripsi dan tes dbt

Studi Kasus: Membangun Model Data E-Commerce dengan dbt

Susan Sun

Freelance Data Scientist

docs: deskripsi dbt buatan pengguna

  • Deskripsi buatan pengguna di file yaml
  • Untuk mendokumentasikan: dbt models, sources, seeds, data tests, dll.
  • Konvensi penamaan:
    _<data source>__<asset>.yml
    
  • Simpan di direktori yang sama dengan aset
looker_ecommerce/
  macros/
  models/
    _looker__models.yml     <------ 
    _looker__sources.yml    <------
    stg_looker__distribution_center.sql
    stg_looker__orders.sql
  seeds/
    looker__distribution_center.csv
Studi Kasus: Membangun Model Data E-Commerce dengan dbt

docs: yaml model dbt

Contoh _looker__models.yml:

version: 2

models:
  - name: model_name
    description: This is a table
    columns:
      - name: column_name
        description: This is a column
      - name: column_name
        description: This is a column

Catatan:

  • version: 2 adalah format konfigurasi schema yang digunakan dbt
  • models menentukan aset yang didokumentasikan oleh user-defined ini
  • 2 spasi sebelum nama tabel
  • 4 spasi sebelum nama kolom
Studi Kasus: Membangun Model Data E-Commerce dengan dbt

dbt data tests: not null dan unique

  • Empat tes data default ada di file yaml:
    • unique
    • not_null
    • accepted_values
    • relationship

1.unique: setiap nilai baris harus unik

- name: table_name
  columns: 
    - name: column_name
      data_tests:
        - not_null
    ...

2.not_null: tidak ada baris yang boleh bernilai null

- name: table_name
  columns: 
    - name: column_name
      data_tests:
        - unique
        - not_null
    - name: column_name
      data_tests:
        - unique
Studi Kasus: Membangun Model Data E-Commerce dengan dbt

dbt data tests: accepted values

3.accepted_values: hanya nilai dalam daftar yang diterima

- name: table_name
  columns: 
    - name: column_name
      data_tests:
        - accepted_values:
            values: ['value_a', 'value_b', 'value_c', NULL]
Studi Kasus: Membangun Model Data E-Commerce dengan dbt

dbt data tests: relationships

4.relationships: integritas referensial (foreign key) antar tabel

- name: table_1
  columns: 
    - name: column_1
      data_tests:
        - relationships:
            to: ref('table_2')
            field: column_2
Studi Kasus: Membangun Model Data E-Commerce dengan dbt

Ayo berlatih!

Studi Kasus: Membangun Model Data E-Commerce dengan dbt

Preparing Video For Download...