Veri doğrulamada en iyi uygulamalar

Sorumlu AI Veri Yönetimi

Maria Prokofieva

Lead ML engineer

Neleri ele alacağız

  • Alt grup analizi
  • Eksik değerler
  • Aykırı değer temizleme
  • Veri tutarsızlıklarını düzeltme
  • Özellik ölçekleme
  • Özellik kodlama
  • Boyut indirgeme
Sorumlu AI Veri Yönetimi

Alt grup analizi

Adım 1: Korumalı özelliklere göre alt gruplara ayırın

Adım 2: Her alt grubun dağılımını ve model başarımını değerlendirin

Adım 3: Her alt grup için adalet metriklerini değerlendirin

Adım 4: Azaltma stratejilerini uygulayın

Sorumlu AI Veri Yönetimi

Eksik veriler

  • Büyük veri kümelerinde yaygın
  • Veri silme
  • Atama stratejileri ve modele dayalı yaklaşımlar
  • Doğrulama için alt grup analizi

eksik veri

Sorumlu AI Veri Yönetimi

Aykırı değer temizleme

  • z-puanları, IQR gibi istatistiksel yöntemler veya sağlam ölçekleme
  • Veri kesitleri arasında adil muameleyi doğrulayın

aykırı değer temizleme

Sorumlu AI Veri Yönetimi

Veri tutarsızlıkları

  • Veri kalitesi, model bütünlüğü ve güvenilirliğini etkiler
  • Veri standartlaştırma ve doğrulama kuralları
  • Alt grup normalizasyonu
Sorumlu AI Veri Yönetimi

Özellik ölçekleme

  • Girdileri dönüştürmek için özellik ölçekleme
  • Gruplar arası dağılımları kontrol ederek doğrulayın

özellik ölçekleme

Sorumlu AI Veri Yönetimi

Özellik kodlama

  • Kodlamanın sonuçlara etkisini değerlendirin
  • Önyargı ve bilgi kaybını kontrol edin
  • Aşırı uyumu kontrol edin
  • Düzenlileştirme ve boyut indirgeme kullanın
Sorumlu AI Veri Yönetimi

Boyut indirgeme

  • Girdileri azaltın, temel bilgiyi koruyun
  • Önyargı oluşturabilir
  • t-SNE gibi adil yaklaşımlar kullanın

boyut indirgeme

Sorumlu AI Veri Yönetimi

Finansal danışman

  • "Yıllık gelir" ve "Yatırım sıklığı" özellikleri
  • Aykırı değerleri düzeltin ve ölçekleyin
  • Alt grup analizi

aykırı değer temizleme

Sorumlu AI Veri Yönetimi

Hadi pratik yapalım!

Sorumlu AI Veri Yönetimi

Preparing Video For Download...