Metadaten und Datenqualität

Einführung in die Datenqualität

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Was sind Metadaten?

Metadaten: Daten über Daten, oder Attribute, die Daten beschreiben

  • Werden verwendet, um Datensätze und Datenelemente zu organisieren und zu verstehen
  • Werden im Datenqualitätsprozess zum Ermitteln von Folgendem verwendet:
    • Definition eines Feldes
    • Verantwortlicher eines Feldes
    • Datum der letzten Aktualisierung des Feldes

Beispiele für Metadatendefinition, Dateneigentümer, Aktualisierungsdatum

Einführung in die Datenqualität

Beispiele für Metadaten

Metadaten sind in einem Datenwörterbuch zu finden.

Beispiele:

  • Name des Geschäftsfeldes
  • Geschäftsdefinition
  • Dateneigentümer
  • Name des technisch physikalischen Felds

Beispiel für Metadaten im Datenkatalog

Einführung in die Datenqualität

Was ist Data-Lineage (Datenherkunft)?

Datenherkunft: Eine Darstellung, wie sich die Daten in einer Pipeline bewegen, von der Eingabe der Daten in der Quelle über jeden Schritt in der Daten-Pipeline bis hin zum Verbrauch.

Beispiel für die Darstellung der Data-Lineage

  • Jede Ebene hat ihre eigenen Metadaten
  • Wird im Datenqualitätsprozess verwendet, um zu bestimmen, wo eine Datenqualitätsregel implementiert werden soll
Einführung in die Datenqualität

Beispiel für die Darstellung der Datenherkunft

Detailliertes Beispiel für Data-Lineage

Einführung in die Datenqualität

Beispiel für Metadaten und Datenherkunft

Beispiel für die Darstellung der Data-Lineage

Einführung in die Datenqualität

Metadaten und Datenherkunft – Beispiel für schlechte Umsetzung

Beispiel für die Darstellung der Data-Lineage

Einführung in die Datenqualität

Metadaten und Datenherkunft – Best-Practice-Beispiel

Beispiel für die Darstellung der Data-Lineage

Einführung in die Datenqualität

Lass uns üben!

Einführung in die Datenqualität

Preparing Video For Download...