Istilah dan konsep kualitas data

Pengantar Kualitas Data

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Mendefinisikan kualitas data

  • Kualitas Data: ukuran sejauh mana data layak untuk tujuan tertentu
  • Kualitas data yang baik = kepercayaan pada data
    • Keputusan bisnis lebih baik
    • Proses bisnis lebih siap
  • Sering diasumsikan kualitas data sudah baik
  • Kualitas data perlu diukur dan dipantau agar data layak digunakan.

tabel data

Pengantar Kualitas Data

Mendefinisikan dimensi kualitas data

Dimensi Kualitas Data: ukuran atribut tertentu dari kualitas data

  • Gunakan dimensi kualitas data untuk mengukur kelayakan data.
    • Kelengkapan
    • Validitas
    • Keunikan
    • Konsistensi
    • Ketepatan waktu
    • Akurasi

kubus

Pengantar Kualitas Data

Kelengkapan sebagai dimensi kualitas data

kotak kotak

Kelengkapan:

  • Level dataset: mengukur sejauh mana semua record yang diharapkan ada.
  • Level elemen data: mengukur sejauh mana semua record terisi saat diharapkan.
  • Masalah bisnis akibat data tidak lengkap:
    • Angka bisa bias
    • Pelanggan bisa terdampak
Pengantar Kualitas Data

Contoh kelengkapan

tabel data

Semua record harus memiliki nilai pada field CustomerName.

Pengantar Kualitas Data

Validitas sebagai dimensi kualitas data

Validitas: mengukur sejauh mana nilai dalam elemen data valid

  • Memerlukan konteks bisnis
  • Tentukan daftar atau kriteria nilai valid
  • Ukuran numerik validitas = jumlah valid/total

kotak kotak

Pengantar Kualitas Data

Contoh validitas

tabel data

  • Nilai CustomerBirthDate harus berupa tanggal di masa lalu.
  • Nilai CustomerAccountType harus Loan atau Deposit.
  • Nilai LatestAccountOpenDate harus berupa tanggal di masa lalu.
Pengantar Kualitas Data

Keunikan sebagai dimensi kualitas data

persegi bergaris

Keunikan: mengukur sejauh mana record dalam dataset tidak terduplikasi

  • Memerlukan konteks bisnis untuk mendefinisikan kriteria record unik
  • Mungkin perlu mencari duplikat pada satu atau beberapa kolom untuk mengidentifikasi error
Pengantar Kualitas Data

Contoh keunikan

tabel data

Semua record harus memiliki CustomerID dan CustomerName yang unik.

Pengantar Kualitas Data

Ayo berlatih!

Pengantar Kualitas Data

Preparing Video For Download...