Regels voor datakwaliteit met dimensies

Inleiding tot datakwaliteit

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Regels voor datakwaliteit

Regel voor datakwaliteit: type bedrijfsregel die controleert of data aan de bedrijfsvereisten voldoet

  • Kan worden gedefinieerd op:
    • Datasetniveau
    • Niveau van gegevenselement

tabel met regels voor datakwaliteit op dataset en gegevenselement

Inleiding tot datakwaliteit

Volledigheidsregel voor datakwaliteit

Regel voor datakwaliteit op dataset: Alle verwachte records uit de bron moeten worden geladen in de doeltabel.

tabel met volledigheidsregel voor datakwaliteit

Regel voor datakwaliteit op gegevenselement: Alle records moeten een Customer ID, Customer Name en Customer Account Type ingevuld hebben.

tabel met volledigheidsregel voor datakwaliteit

Inleiding tot datakwaliteit

Tijdigheidsregel voor datakwaliteit

Regel voor datakwaliteit op dataset: Alle records in de klantendataset moeten vóór 9:00 uur geladen zijn.

tabel met tijdigheidsregel voor datakwaliteit

Regel voor datakwaliteit op gegevenselement: Alle records moeten een tax ID ingevuld hebben zodra de accountstatus van de klant voor het eerst "Open" is.

tabel met tijdigheidsregel voor datakwaliteit

Inleiding tot datakwaliteit

Validiteitsregel voor datakwaliteit

Regel voor datakwaliteit op gegevenselement:

  • Alle records moeten een geboortedatum hebben in formaat MM/DD/JJJJ en die moet in het verleden liggen.
  • Alle records moeten een accountstatus hebben: Open, Closed of Pending.

tabel met validiteitsregel voor datakwaliteit

Inleiding tot datakwaliteit

Consistentieregel voor datakwaliteit

Regel voor datakwaliteit op dataset: Het aantal records dat vandaag is geladen moet binnen +/- 5% liggen van het aantal van gisteren.

tabel met consistentieregel voor datakwaliteit

Regel voor datakwaliteit op gegevenselement: Alle Customer ID-waarden in de AccountTable moeten ook voorkomen in de CustomerTable.

tabel met consistentieregel voor datakwaliteit

Inleiding tot datakwaliteit

Nauwkeurigheidsregel voor datakwaliteit

Regel voor datakwaliteit op gegevenselement: Alle records in de CustomerTable moeten correcte velden Customer Name, Customer Birthdate en Customer Address hebben vergeleken met het belastingformulier.

tabel met nauwkeurigheidsregel voor datakwaliteit

belastingformulier voor nauwkeurigheidsvergelijking

Inleiding tot datakwaliteit

Uniekheidsregel voor datakwaliteit

Regel voor datakwaliteit op gegevenselement:

  • Alle records moeten een unieke Customer ID hebben.
  • Alle records moeten een unieke combinatie hebben van klantnaam, geboortedatum en adres.

tabel met uniekheidsregel voor datakwaliteit

Inleiding tot datakwaliteit

Laten we oefenen!

Inleiding tot datakwaliteit

Preparing Video For Download...