Bonus datakwaliteitsdimensies

Inleiding tot datakwaliteit

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Wat is ook alweer een dimensie?

Datakwaliteitsdimensie: een meting van een specifiek kenmerk van de kwaliteit van data

  • Gebruik dimensies om te bepalen hoe geschikt data is voor het doel.

tabel met de zes datakwaliteitsdimensies met consistentie, tijdigheid en nauwkeurigheid gemarkeerd

Inleiding tot datakwaliteit

Tijdigheid als dimensie

Tijdigheid: meet in hoeverre een dataset beschikbaar is wanneer verwacht

  • hangt af van service level agreements tussen technische en business-teams

tabel met voorbeeld van tijdigheid met SLA's en laadtijden van tabellen

Inleiding tot datakwaliteit

Voorbeeld: tijdigheid

voorbeeld van tijdigheid met datakwaliteitsregel en gegevens over laadtijd van tabel

Inleiding tot datakwaliteit

Consistentie als dimensie

Consistentie: meet in hoeverre data hetzelfde is in alle instanties van de data.

twee tabellen met rijen in dezelfde kleur, behalve één rij die een inconsistentie tussen tabellen toont

Inleiding tot datakwaliteit

Voorbeelden van consistentie

consistentievoorbeelden van datakwaliteitsregels en tabellen met data die voor consistentie falen

Inleiding tot datakwaliteit

Nauwkeurigheid als dimensie

Nauwkeurigheid: meet in hoeverre data klopt en de werkelijkheid weergeeft.

  • lastig te meten, want dit hangt af van een beschikbare en correcte bron van waarheid

twee tabellen die een geverifieerde bron en een downstream-tabel met één onjuiste waarde symboliseren

Inleiding tot datakwaliteit

Voorbeeld: nauwkeurigheid

nauwkeurigheidsvoorbeeld met een voorbeeldbelastingformulier, datakwaliteitsregel en een klantentabel die met het formulier wordt vergeleken

Inleiding tot datakwaliteit

Laten we oefenen!

Inleiding tot datakwaliteit

Preparing Video For Download...