Selectie van databronnen

Verantwoord AI-gegevensbeheer

Maria Prokofieva

Lead ML engineer

Waarom selecteren?

  • Borg datakwaliteit
  • Juridische naleving
  • Eerlijkheid

 

Verwarde vrouw kiest tussen twee knoppen en drukt op de blauwe

Verantwoord AI-gegevensbeheer

Stap 1. Projectrelevantie

  • Relevantie voor projectdoelen
  • Check op afstemming met
    • Vakgebied
    • Scope
    • Verwachte uitkomsten

Doelpictogram

Verantwoord AI-gegevensbeheer

Stap 2. Integriteit van de databron

  • Beoordeel integriteit en betrouwbaarheid
  • Reviews en testimonials
  • Transparantie in dataverzameling
  • Naleving en licenties
  • Hoge kwaliteit: regelmatige updates

Handshake en schild-pictogram

Verantwoord AI-gegevensbeheer

Stap 3. Juridische naleving

  • Rechtmatigheid van data
  • Juridische naleving voor het project
  • Juridisch advies:
    • Toepasselijke wetten en beperkingen
    • Geanonimiseerde data
    • Eisen aan dataveiligheid
  • Goedgekeurd door juridisch team

wetten

Verantwoord AI-gegevensbeheer

Stap 4. Technische kwaliteit

  • Structurele integriteit en bruikbaarheid
  • Volledig
  • Consistent
  • Nauwkeurig
  • Actueel

Keurmerk van kwaliteit

Verantwoord AI-gegevensbeheer

Stap 5. Bias en representativiteit

  • Analyse van demografische vertegenwoordiging
  • Beschermde kenmerken
  • Verdeling van groepen analyseren
  • Eerlijkheidsmetrics
  • Data-augmentatie
Verantwoord AI-gegevensbeheer

Stap 6. Selectie

  • Opnemen als:
    • Sluit consistent aan
    • Corrigeerbaar via transformatie, augmentatie of algoritmen
  • Uitsluiten als:
    • Schiet tekort op kernpunten
  • Raadpleeg domeinexperts

Een selectie maken

Verantwoord AI-gegevensbeheer

Project stedelijke verkeersstromen

Databronnen:

  1. Verkeersintensiteitstellingen
  2. Notulen van raadsvergaderingen
  3. GPS-trackingdata
  4. Socialmedia-mentions over verkeerssituatie
  5. Woon-werkverkeerenquête

Project stedelijke verkeersstromen

1 Afbeeldingen door Streamline HQ
Verantwoord AI-gegevensbeheer

Project stedelijke verkeersstromen

Uitsluiten:

  • Socialmediadata
  • Woon-werkverkeerenquête

Aanpassingen:

  • Notulen raadsvergaderingen
  • Verkeersintensiteitstellingen
    • Extra sensordata
  • GPS-data
    • Extra cameradata
Verantwoord AI-gegevensbeheer

Laten we oefenen!

Verantwoord AI-gegevensbeheer

Preparing Video For Download...