Règles de qualité des données utilisant les dimensions

Introduction à la qualité des données

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Règles de qualité des données

Règle de qualité des données : un type de règle qui permet de vérifier si les données répondent aux exigences de l’entreprise

  • Peut être défini :
    • Au niveau de l’ensemble de données
    • Au niveau des éléments de données

tableau décrivant les règles de qualité des ensembles de données et des éléments de données

Introduction à la qualité des données

Règle de qualité des données d’exhaustivité

Au niveau de l’ensemble de données : Tous les enregistrements attendus de la source doivent être chargés dans la table cible.

tableau décrivant la règle de qualité des données d’exhaustivité

Au niveau des éléments de données : Tous les enregistrements doivent comporter un ID client, un nom de client et un type de compte client.

tableau décrivant la règle de qualité des données d’exhaustivité

Introduction à la qualité des données

Règle de qualité des données d’actualité

Au niveau de l’ensemble de données : Tous les enregistrements de l’ensemble de données clients doivent être chargés avant 9 heures.

tableau illustrant la règle de qualité des données d’actualité

Au niveau des éléments de données : Tous les enregistrements doivent comporter un ID fiscal dès que le compte du client passe à l’état Open (ouvert).

tableau illustrant la règle de qualité des données d’actualité

Introduction à la qualité des données

Règle de qualité des données de validité

Au niveau des éléments de données :

  • Tous les enregistrements doivent avoir une valeur de date de naissance au format MM/JJ/AAAA et la valeur doit être passée.
  • Tous les enregistrements doivent avoir un état de compte avec les valeurs Open, Closed ou Pending.

tableau illustrant la règle de qualité des données de validité

Introduction à la qualité des données

Règle de qualité des données de cohérence

Au niveau de l’ensemble de données : Le nombre d’enregistrements chargés aujourd’hui doit se situer à +/- 5 % du nombre d’enregistrements chargés hier.

tableau décrivant la règle de qualité des données de cohérence

Au niveau des éléments de données : Toutes les valeurs d’ID client dans la table des comptes doivent également être présentes dans la table des clients.

tableau décrivant la règle de qualité des données de cohérence

Introduction à la qualité des données

Règle de qualité des données d’exactitude

Au niveau des éléments de données : Les champs Nom du client, Date de naissance du client et Adresse du client de tous les enregistrements de la table de clients doivent correspondre au formulaire fiscal.

tableau illustrant la règle de qualité des données d’exactitude

formulaire fiscal utilisé pour la comparaison de l’exactitude

Introduction à la qualité des données

Règle de qualité des données d’unicité

Au niveau des éléments de données :

  • Tous les enregistrements doivent avoir un ID client unique.
  • Tous les enregistrements doivent avoir une combinaison unique de nom du client, date de naissance du client et adresse du client.

tableau décrivant la règle de qualité des données d’unicité

Introduction à la qualité des données

Passons à la pratique !

Introduction à la qualité des données

Preparing Video For Download...