Weitere Datenqualitätsdimensionen

Einführung in die Datenqualität

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Zur Erinnerung: was ist eine Dimension

Datenqualitätsdimension: ein Maß für ein bestimmtes Attribut der Datenqualität

  • Mit Datenqualitätsdimensionen quantifiziert man die Zweckmäßigkeit der Daten.

Tabelle mit den sechs Dimensionen der Datenqualität, wobei Konsistenz, Aktualität und Genauigkeit hervorgehoben sind

Einführung in die Datenqualität

Aktualität als Dimension

Aktualität: misst, inwieweit ein Datensatz zum erwarteten Zeitpunkt verfügbar ist

  • hängt von Service Level Agreements ab, die zwischen technischen und geschäftlichen Ressourcen vereinbart werden

Tabelle mit Beispielen für Aktualität, die SLAs und die Ladezeiten der Tabellen auflistet

Einführung in die Datenqualität

Beispiel für Aktualität

Beispiel für Aktualität als Datenqualitätsregel und Tabellenladedaten und -dauer

Einführung in die Datenqualität

Konsistenz als Dimension

Konsistenz: misst, inwiefern die Daten über alle Instanzen hinweg gleich sind.

Zwei Tabellen mit gleichfarbigen Zeilen bis auf eine Zeile, was auf eine Inkonsistenz zwischen den Tabellen hinweist

Einführung in die Datenqualität

Beispiele für Konsistenz

Beispiele für Konsistenz als Datenqualitätsregel und Tabellen mit Daten, die nicht konsistent sind

Einführung in die Datenqualität

Genauigkeit als Dimension

Genauigkeit: misst, inwieweit die Daten korrekt sind und der Wahrheit entsprechen.

  • schwierig zu messen, weil die Quelle der Wahrheit verfügbar und genau sein muss

Zwei Tabellen, die eine verifizierte Quelle und eine nachgelagerte Tabelle mit einem falschen Wert symbolisieren

Einführung in die Datenqualität

Beispiel für Genauigkeit

Beispiel für Genauigkeit mit einem Muster-Steuerformular, einer Datenqualitätsregel und einer Tabelle mit Kundendaten, die mit dem Steuerformular abgeglichen werden

Einführung in die Datenqualität

Lass uns üben!

Einführung in die Datenqualität

Preparing Video For Download...