Metadaten und Datenqualität

Einführung in die Datenqualität

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Was sind Metadaten?

Metadaten: Daten über Daten, oder Attribute, die Daten beschreiben

  • Werden verwendet, um Datensätze und Datenelemente zu organisieren und zu verstehen
  • Werden im Datenqualitätsprozess zum Ermitteln von Folgendem verwendet:
    • Definition eines Feldes
    • Besitzer eines Feldes
    • Datum der letzten Aktualisierung des Feldes

Beispiele für Metadatendefinition, Dateneigentümer, Aktualisierungsdatum

Einführung in die Datenqualität

Beispiele für Metadaten

Metadaten sind in einem Datenwörterbuch zu finden.

Beispiele:

  • Name des Geschäftsfeldes
  • Geschäftsdefinition
  • Dateneigentümer
  • Name des technisch physikalischen Felds

Beispiel für Metadaten im Datenkatalog

Einführung in die Datenqualität

Was ist Data-Lineage?

Data-Lineage: Eine Darstellung, wie sich die Daten in einer Pipeline bewegen, von der Eingabe der Daten in der Quelle über jeden Schritt in der Daten-Pipeline bis hin zum Verbrauch.

Beispiel für die Darstellung der Data-Lineage

  • Jede Ebene hat ihre eigenen Metadaten
  • Wird im Datenqualitätsprozess verwendet, um zu bestimmen, wo eine Datenqualitätsregel implementiert werden soll
Einführung in die Datenqualität

Beispiel für die Darstellung der Data-Lineage

Detailliertes Beispiel für Data-Lineage

Einführung in die Datenqualität

Beispiel für Metadaten und Data-Lineage

Beispiel für die Darstellung der Data-Lineage

Einführung in die Datenqualität

Metadaten und Data-Lineage – Beispiel für schlechte Praxis

Beispiel für die Darstellung der Data-Lineage

Einführung in die Datenqualität

Metadaten und Data-Lineage – Best-Practice-Beispiel

Beispiel für die Darstellung der Data-Lineage

Einführung in die Datenqualität

Lass uns üben!

Einführung in die Datenqualität

Preparing Video For Download...