Datenqualitätsregeln basierend auf Dimensionen

Einführung in die Datenqualität

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Datenqualitätsregeln

Datenqualitätsregel: eine Art Geschäftsregel, die prüft, ob die Daten den Geschäftsanforderungen entsprechen

  • Kann definiert werden auf:
    • Datensatzebene
    • Datenelementebene

Tabelle mit Datenqualitätsregeln auf Datensatz- und Datenelementebene

Einführung in die Datenqualität

Datenqualitätsregel „Vollständigkeit“

Datenqualitätsregel auf Datensatzebene: Alle erwarteten Datensätze aus der Quelle müssen in die Zieltabelle geladen werden.

Tabelle zur Darstellung der Datenqualitätsregel „Vollständigkeit“

Datenqualitätsregel auf Datenelementebene: Alle Datensätze müssen eine Kunden-ID, einen Kundennamen und einen Kundenkontotyp enthalten.

Tabelle zur Darstellung der Datenqualitätsregel „Vollständigkeit“

Einführung in die Datenqualität

Datenqualitätsregel „Aktualität“

Datenqualitätsregel auf Datensatzebene: Alle Datensätze im Kundendatensatz müssen bis 9:00 Uhr geladen sein.

Tabelle zur Darstellung der Datenqualitätsregel „Aktualität“

Datenqualitätsregel auf Datenelementebene: Alle Datensätze müssen eine Steuernummer enthalten, wenn der Kontostatus des Kunden zum ersten Mal „Offen“ ist.

Tabelle zur Darstellung der Datenqualitätsregel „Aktualität“

Einführung in die Datenqualität

Datenqualitätsregel „Gültigkeit“

Datenqualitätsregel auf Datenelementebene:

  • Alle Datensätze müssen einen Wert für das Geburtsdatum im Format MM/TT/JJJJ haben, und das Datum muss in der Vergangenheit liegen.
  • Alle Datensätze müssen einen Kontostatus von „Offen“, „Geschlossen“ oder „Ausstehend“ haben.

Tabelle zur Darstellung der Datenqualitätsregel „Gültigkeit“

Einführung in die Datenqualität

Datenqualitätsregel „Konsistenz“

Datenqualitätsregel auf Datensatzebene: Die Anzahl der heute geladenen Datensätze muss innerhalb von +/- 5 % der Anzahl der gestern geladenen Datensätze liegen.

Tabelle zur Darstellung der Datenqualitätsregel „Konsistenz“

Datenqualitätsregel auf Datenelementebene: Kunden-ID-Werte in der Kontotabelle müssen auch in der Kundentabelle vorhanden sein.

Tabelle zur Darstellung der Datenqualitätsregel „Konsistenz“

Einführung in die Datenqualität

Datenqualitätsregel „Genauigkeit“

Datenqualitätsregel auf Datenelementebene: Alle Datensätze in der Kundentabelle müssen beim Abgleich mit dem Steuerformular korrekte Angaben für den Kundennamen, das Geburtsdatum und die Adresse des Kunden enthalten.

Tabelle zur Darstellung der Datenqualitätsregel „Genauigkeit“

Steuerformular, das für den Genauigkeitsvergleich verwendet wird

Einführung in die Datenqualität

Datenqualitätsregel „Eindeutigkeit“

Datenqualitätsregel auf Datenelementebene:

  • Alle Datensätze müssen eine eindeutige Kunden-ID enthalten.
  • Alle Datensätze müssen eine eindeutige Kombination aus den Feldern Kundenname, Geburtsdatum und Kundenadresse enthalten.

Tabelle zur Darstellung der Datenqualitätsregel „Eindeutigkeit“

Einführung in die Datenqualität

Lass uns üben!

Einführung in die Datenqualität

Preparing Video For Download...