Règles de qualité des données utilisant les dimensions

Introduction à la qualité des données

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Règles de qualité des données

Règle de qualité des données : un type de règle qui permet de vérifier si les données répondent aux exigences de l’entreprise

  • Peut être défini :
    • Au niveau de l’ensemble de données
    • Au niveau des éléments de données

tableau décrivant les règles de qualité des ensembles de données et des éléments de données

Introduction à la qualité des données

Règle de qualité des données d’exhaustivité

Au niveau de l’ensemble de données : Tous les enregistrements attendus de la source doivent être chargés dans la table cible.

tableau décrivant la règle de qualité des données d’exhaustivité

Au niveau des éléments de données : Tous les enregistrements doivent comporter un identifiant client, un nom client et un type de compte client.

tableau décrivant la règle de qualité des données d’exhaustivité

Introduction à la qualité des données

Règle de qualité des données d’actualité

Au niveau de l’ensemble de données : Tous les enregistrements de l’ensemble de données clients doivent être chargés avant 9 heures.

tableau illustrant la règle de qualité des données d’actualité

Au niveau des éléments de données : Tous les dossiers doivent comporter un numéro d'identification fiscale dès que le statut du compte du client est « Ouvert » pour la première fois.

tableau illustrant la règle de qualité des données d’actualité

Introduction à la qualité des données

Règle de qualité des données de validité

Au niveau des éléments de données :

  • Tous les enregistrements doivent comporter une date de naissance au format MM/JJ/AAAA, et cette date doit être passée.
  • Tous les enregistrements doivent avoir un état de compte avec les valeurs Open, Closed ou Pending.

tableau illustrant la règle de qualité des données de validité

Introduction à la qualité des données

Règle de qualité des données de cohérence

Au niveau de l’ensemble de données : Le nombre d’enregistrements chargés aujourd’hui doit se situer à +/- 5 % du nombre d’enregistrements chargés hier.

tableau décrivant la règle de qualité des données de cohérence

Au niveau des éléments de données : Toutes les valeurs d'identifiant client dans le tableau AccountTable doivent également être présentes dans le tableau CustomerTable.

tableau décrivant la règle de qualité des données de cohérence

Introduction à la qualité des données

Règle de qualité des données d’exactitude

Au niveau des éléments de données : Les champs Nom du client, Date de naissance du client et Adresse du client de tous les enregistrements de la table de clients doivent correspondre au formulaire fiscal.

tableau illustrant la règle de qualité des données d’exactitude

formulaire fiscal utilisé pour la comparaison de l’exactitude

Introduction à la qualité des données

Règle de qualité des données d’unicité

Au niveau des éléments de données :

  • Tous les enregistrements doivent comporter un identifiant client unique.
  • Tous les enregistrements doivent avoir une combinaison unique de nom du client, date de naissance du client et adresse du client.

tableau décrivant la règle de qualité des données d’unicité

Introduction à la qualité des données

Passons à la pratique !

Introduction à la qualité des données

Preparing Video For Download...