Databronnen

Verantwoord AI-gegevensbeheer

Maria Prokofieva

Lead ML engineer

Zo meteen...

  • Typen databronnen
  • Beperkingen en selectie
  • Meerdere bronnen integreren

Mensen halen documenten uit planken, gebruiken een vergrootglas en zoeken bestanden in een elektronische database

Verantwoord AI-gegevensbeheer

Waarom de databron belangrijk is

  • Integriteit
  • Diversiteit
  • Eerlijke representatie

databron koken

1 Afbeelding door Streamline HQ
Verantwoord AI-gegevensbeheer

Typen naar herkomst

  • Primair

    • Data verzameld binnen het project
    • Naleving en toestemming
  • Secundair

    • Data uit bestaande bronnen
    • Licentieafspraken

Licentiecontract abstract concept

Verantwoord AI-gegevensbeheer

Typen naar aard

  • Kwantitatief

    • Numerieke data
  • Kwalitatief

    • Niet-numeriek
  • Gemengd

    • Combinatie van numeriek en niet-numeriek

nummers naar tekst

1 Afbeelding door Streamline HQ
Verantwoord AI-gegevensbeheer

Typen naar tijdelijkheid

  • Statish
    • Verandert niet in de tijd
    • Volkstellingsdata
    • Bedrijfsadressen
  • Dynamisch
    • Real-time bijgewerkt
    • Socialmediastromen
    • API
    • Beursfeeds
    • Sensordata

dynamische stromen

1 Afbeelding door Streamline HQ
Verantwoord AI-gegevensbeheer

Diversiteit en eerlijkheid in databronnen

  • Directe vooringenomenheid van dataverzamelaars
  • Meetbare bias-checks
  • Niet actueel, verouderde vooroordelen
  • Overgenomen biases uit de originele context
  • Genuanceerde analyse
  • Evolueren continu, mogelijk real-time bias
Verantwoord AI-gegevensbeheer

Project stedelijke verkeersstroom

Databronnen:

  • Historische verkeersdata
  • Notulen gemeenteraad
  • GPS-trackingdata

Project stedelijke verkeersstroom

1 Afbeeldingen door Streamline HQ
Verantwoord AI-gegevensbeheer

Historische verkeersdata

  • Verkeersafdeling van de stad
  • Laatste 5 jaar
  • Bevat voertuigenaantallen en tijdstip/dag van de week

Dit is een primaire statische kwantitatieve bron

verkeersdata

1 Afbeelding door Streamline HQ
Verantwoord AI-gegevensbeheer

Notulen raadsvergaderingen

  • Openbare stukken op de website van de raad
  • Samenvattingen van stadsplanning en verkeersbeheer

Dit is een kwalitatieve secundaire bron

notulen

1 Afbeelding door Streamline HQ
Verantwoord AI-gegevensbeheer

GPS-data

  • Primaire dynamische bron
  • Direct inzicht in actuele verkeerssituatie, snelheden en vertragingen

GPS

1 Afbeelding door Streamline HQ
Verantwoord AI-gegevensbeheer

Laten we oefenen!

Verantwoord AI-gegevensbeheer

Preparing Video For Download...