Datenqualitätsregeln basierend auf Dimensionen

Einführung in die Datenqualität

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Datenqualitätsregeln

Datenqualitätsregel: eine Art Geschäftsregel, die prüft, ob die Daten den Geschäftsanforderungen entsprechen

  • Kann definiert werden auf:
    • Datensatzebene
    • Datenelementebene

Tabelle mit Datenqualitätsregeln auf Datensatz- und Datenelementebene

Einführung in die Datenqualität

Datenqualitätsregel „Vollständigkeit“

Datenqualitätsregel auf Datensatzebene: Alle erwarteten Datensätze aus der Quelle müssen in die Zieltabelle geladen werden.

Tabelle zur Darstellung der Datenqualitätsregel „Vollständigkeit“

Datenqualitätsregel auf Datenelementebene: Alle Datensätze müssen eine Kunden-ID, einen Kundennamen und einen Kundenkontotyp enthalten.

Tabelle zur Darstellung der Datenqualitätsregel „Vollständigkeit“

Einführung in die Datenqualität

Datenqualitätsregel „Aktualität“

Datenqualitätsregel auf Datensatzebene: Alle Datensätze im Kundendatensatz müssen bis 9:00 Uhr geladen sein.

Tabelle zur Darstellung der Datenqualitätsregel „Aktualität“

Datenqualitätsregel auf Datenelementebene: Alle Datensätze müssen eine Steuernummer enthalten, wenn der Kontostatus des Kunden zum ersten Mal „Open“ ist.

Tabelle zur Darstellung der Datenqualitätsregel „Aktualität“

Einführung in die Datenqualität

Datenqualitätsregel „Gültigkeit“

Datenqualitätsregel auf Datenelementebene:

  • Alle Datensätze müssen ein Geburtsdatum im Format MM/TT/JJJJ haben und der Wert muss in der Vergangenheit liegen.
  • Alle Datensätze müssen einen Kontostatus von „Open“, „Closed“ oder „Pending“ haben.

Tabelle zur Darstellung der Datenqualitätsregel „Gültigkeit“

Einführung in die Datenqualität

Datenqualitätsregel „Konsistenz“

Datenqualitätsregel auf Datensatzebene: Die Anzahl der heute geladenen Datensätze muss innerhalb von +/- 5 % der Anzahl der gestern geladenen Datensätze liegen.

Tabelle zur Darstellung der Datenqualitätsregel „Konsistenz“

Datenqualitätsregel auf Datenelementebene: Alle Kunden-ID-Werte in der AccountTable müssen auch in der CustomerTable vorhanden sein.

Tabelle zur Darstellung der Datenqualitätsregel „Konsistenz“

Einführung in die Datenqualität

Datenqualitätsregel „Genauigkeit“

Datenqualitätsregel auf Datenelementebene: Alle Datensätze in der CustomerTable müssen beim Vergleich mit dem Steuerformular korrekte Angaben für den Kundennamen, das Geburtsdatum und die Adresse des Kunden enthalten.

Tabelle zur Darstellung der Datenqualitätsregel „Genauigkeit“

Steuerformular, das für den Genauigkeitsvergleich verwendet wird

Einführung in die Datenqualität

Datenqualitätsregel „Eindeutigkeit“

Datenqualitätsregel auf Datenelementebene:

  • Alle Datensätze müssen eine Kunden-ID enthalten.
  • Alle Datensätze müssen eine eindeutige Kombination aus den Feldern Kundenname, Geburtsdatum und Kundenadresse enthalten.

Tabelle zur Darstellung der Datenqualitätsregel „Eindeutigkeit“

Einführung in die Datenqualität

Lass uns üben!

Einführung in die Datenqualität

Preparing Video For Download...