Veri kalitesi terimleri ve kavramları

Veri Kalitesine Giriş

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Veri kalitesini tanımlama

  • Veri Kalitesi: verinin amaca uygunluk derecesinin ölçümü
  • İyi veri kalitesi = veriye güven
    • Daha iyi iş kararları
    • Daha donanımlı iş süreçleri
  • Çoğu zaman iyi veri kalitesi varsayılır
  • Verinin kullanıma uygunluğunu sağlamak için veri kalitesi ölçülmeli ve izlenmelidir.

veri tablosu

Veri Kalitesine Giriş

Veri kalitesi boyutlarını tanımlama

Veri Kalitesi Boyutu: verinin belirli bir niteliğine ilişkin kalite ölçümü

  • Verinin amaca uygunluğunu saymak için veri kalitesi boyutlarını kullanın.
    • Tamlık
    • Geçerlilik
    • Eşsizlik
    • Tutarlılık
    • Zamanlılık
    • Doğruluk

küp

Veri Kalitesine Giriş

Bir veri kalitesi boyutu olarak tamlık

kare ızgara

Tamlık:

  • Veri kümesi düzeyi: beklenen tüm kayıtların mevcut olma derecesini ölçer.
  • Veri öğesi düzeyi: beklenildiğinde tüm kayıtlarda verinin dolu olma derecesini ölçer.
  • Eksik verinin yol açtığı iş sorunları:
    • Sayılar çarpıtılabilir
    • Müşteriler etkilenebilir
Veri Kalitesine Giriş

Tamlık örneği

veri tablosu

Tüm kayıtlarda CustomerName alanı doldurulmuş olmalıdır.

Veri Kalitesine Giriş

Bir veri kalitesi boyutu olarak geçerlilik

Geçerlilik: bir veri öğesindeki değerlerin ne ölçüde geçerli olduğunu ölçer

  • İş bağlamı gerektirir
  • Geçerli değerler için liste veya ölçüt tanımlayın
  • Geçerliliğin sayısal ölçümü = geçerli sayısı/toplam sayı

kare ızgara

Veri Kalitesine Giriş

Geçerlilik örneği

veri tablosu

  • CustomerBirthDate geçmişte bir tarih olmalıdır.
  • CustomerAccountType yalnızca Loan veya Deposit olmalıdır.
  • LatestAccountOpenDate geçmişte bir tarih olmalıdır.
Veri Kalitesine Giriş

Bir veri kalitesi boyutu olarak eşsizlik

çizgili kare

Eşsizlik: bir veri kümesindeki kayıtların ne ölçüde yinelenmediğini ölçer

  • Eşsiz kayıt ölçütlerini tanımlamak için iş bağlamı gerekir
  • Hataları bulmak için tek veya birden çok sütunda yinelenenleri aramak gerekebilir
Veri Kalitesine Giriş

Eşsizlik örneği

veri tablosu

Tüm kayıtlarda benzersiz CustomerID ve CustomerName olmalıdır.

Veri Kalitesine Giriş

Hadi pratik yapalım!

Veri Kalitesine Giriş

Preparing Video For Download...