Metadata en datakwaliteit

Inleiding tot datakwaliteit

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Wat is metadata?

Metadata: data over data, of kenmerken die data beschrijven

  • Helpt datasets en data-elementen te ordenen en te begrijpen
  • Gebruikt in datakwaliteit om te bepalen:
    • definitie van een veld
    • eigenaar van een veld
    • laatste bijwerkdatum van een veld

voorbeelden van metadata: definitie, data-eigenaar, bijwerkdatum

Inleiding tot datakwaliteit

Voorbeelden van metadata

Metadata vind je in een datadictionary.

Voorbeelden:

  • Zakelijke veldnaam
  • Zakelijke definitie
  • Data-eigenaar
  • Technische fysieke veldnaam

voorbeeld van metadata in datacatalogus

Inleiding tot datakwaliteit

Wat is data lineage?

Data lineage: weergave van hoe data door een pipeline beweegt, vanaf invoer in de bron via elke stap in de datapipeline tot consumptie.

voorbeeld van data lineage

  • Elke laag heeft eigen metadata
  • Gebruikt in datakwaliteit om te bepalen waar een datakwaliteitsregel komt
Inleiding tot datakwaliteit

Voorbeeld van data lineage

gedetailleerd voorbeeld van data lineage

Inleiding tot datakwaliteit

Metadata en data lineage: voorbeeld

voorbeeld van data lineage

Inleiding tot datakwaliteit

Metadata en data lineage: slechte praktijk

voorbeeld van data lineage

Inleiding tot datakwaliteit

Metadata en data lineage: best practice

voorbeeld van data lineage

Inleiding tot datakwaliteit

Laten we oefenen!

Inleiding tot datakwaliteit

Preparing Video For Download...