Veri kaynakları

Sorumlu AI Veri Yönetimi

Maria Prokofieva

Lead ML engineer

Sırada...

  • Veri kaynağı türleri
  • Sınırlamalar ve seçim
  • Çoklu veri kaynaklarını bütünleme

Raflardan belge alan, büyüteç kullanan ve elektronik veritabanında dosya arayan kişiler

Sorumlu AI Veri Yönetimi

Veri kaynağı neden önemlidir

  • Bütünlük
  • Çeşitlilik
  • Adil temsil

veri kaynağı hazırlama

1 Görsel: Streamline HQ
Sorumlu AI Veri Yönetimi

Kökenine göre türler

  • Birincil

    • Proje içinde toplanan veriler
    • Uyum ve rıza
  • İkincil

    • Mevcut kaynaklardan edinilen veriler
    • Lisans anlaşmaları

Lisans sözleşmesi soyut kavramı

Sorumlu AI Veri Yönetimi

Doğasına göre türler

  • Nicel

    • Sayısal veri
  • Nitel

    • Sayısal olmayan
  • Karma

    • Sayısal ve sayısal olmayanın birleşimi

sayılar metne

1 Görsel: Streamline HQ
Sorumlu AI Veri Yönetimi

Zamansallığa göre türler

  • Statik
    • Zamanla değişmez
    • Nüfus sayımı verisi
    • Kurumsal adresler
  • Dinamik
    • Gerçek zamanlı güncellenir
    • Sosyal medya akışları
    • API
    • Finansal piyasa akışları
    • Sensör verisi

dinamik akışlar

1 Görsel: Streamline HQ
Sorumlu AI Veri Yönetimi

Veri kaynaklarında çeşitlilik ve adillik

  • Veri toplayıcıların doğrudan önyargıları
  • Ölçülebilir önyargı kontrolleri
  • Güncel gerçekleri yansıtmama, eski önyargılar
  • Kaynak bağlamından miras önyargılar
  • Nüanslı analiz
  • Sürekli evrilir; gerçek zamanlı önyargılar doğurabilir
Sorumlu AI Veri Yönetimi

Kentsel trafik akışı projesi

Veri kaynakları:

  • Tarihsel trafik verisi
  • Belediye meclisi tutanakları
  • GPS izleme verisi

Kentsel trafik akışı projesi

1 Görseller: Streamline HQ
Sorumlu AI Veri Yönetimi

Tarihsel trafik verisi

  • Şehrin ulaşım birimi
  • Son 5 yıl
  • Araç sayıları ve gün/saat bilgileri içerir

Bu bir birincil statik nicel kaynaktır

trafik verisi

1 Görsel: Streamline HQ
Sorumlu AI Veri Yönetimi

Meclis toplantı tutanakları

  • Meclis sitesinde kamuya açık kayıtlar
  • Kentsel planlama ve trafik yönetimi özetleri

Bu bir nitel ikincil kaynaktır

tutanaklar

1 Görsel: Streamline HQ
Sorumlu AI Veri Yönetimi

GPS verisi

  • Birincil dinamik kaynak
  • Mevcut trafik durumu, hız ve gecikmelere anlık içgörü

GPS

1 Görsel: Streamline HQ
Sorumlu AI Veri Yönetimi

Hadi pratik yapalım!

Sorumlu AI Veri Yönetimi

Preparing Video For Download...