Veri kalitesi ve alımı

MLOps Kavramları

Folkert Stijnman

ML Engineer

Veri kalitesi ve alımı

Makine öğrenimi yaşam döngüsü veri edinimi

MLOps Kavramları

Veri kalitesi nedir?

  • Veri kalitesi, verinin amacına ne kadar iyi hizmet ettiğinin ölçüsüdür
  • Çeşitli boyutlarla değerlendirilir
  • ML modelinin kalitesi veriye bağlıdır
MLOps Kavramları

Veri kalitesi boyutları

  • Doğruluk
  • Tamlık
  • Tutarlılık
  • Zamanlılık
MLOps Kavramları

Veri kalitesi boyutlarına örnek

Boyut Yanıtlanacak örnek soru Boyut kalitesine örnek
Doğruluk Verimiz müşteriyi doğru tanımlıyor mu? Veride müşterinin yaşı 18, gerçekte 32.
Tamlık Eksik müşteri verisi var mı? Müşterilerin %80'inde soyadı yok.
Tutarlılık Müşteri tanımı şirket genelinde eşitlenmiş mi? Bir veritabanında müşteri aktif, diğerinde aktif değil.
Zamanlılık Müşteri sipariş verisi ne zaman erişilebilir? Siparişler gün sonunda senkronize edilir, gerçek zamanlı değildir.

Düşük veri kalitesi projenin sonu değildir!

MLOps Kavramları

Veri alımı

Veri hattı

MLOps Kavramları

Hadi pratik yapalım!

MLOps Kavramları

Preparing Video For Download...