Détection des anomalies

Introduction à la qualité des données

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Définition de la détection des anomalies

Détection des anomalies : lorsqu’un algorithme de machine learning est utilisé pour apprendre à connaître un ensemble de données à l’aide de données historiques et identifier les problèmes potentiels de qualité des données

loupe avec une horloge indiquant le suivi dans le temps et une flèche pointant vers une table où une anomalie possible a été détectée

Introduction à la qualité des données

Avantages de la détection des anomalies

Avantages :

  • Contrôle les données à grande échelle et pas seulement les éléments de données critiques
  • Nécessite peu de connaissances de l’entreprise, car l’algorithme de machine learning apprend à reconnaître les erreurs
  • Peut détecter les dérives des données et les insights non évidents sur les données

diagramme avec plusieurs sources de données différentes symbolisant la qualité des données à grande échelle

Introduction à la qualité des données

Utiliser la détection des anomalies

  1. Lorsqu’une grande quantité de données est disponible
  2. Lorsqu’une grande quantité de données nécessite un contrôle de la qualité des données
    • travail manuel requis minimal
    • mise en place du suivi à grande échelle
    • automatisation de la recherche d’anomalies

trois lignes de texte sur l’utilisation des règles de détection et préventives, et de la détection des anomalies

Introduction à la qualité des données

Exemple de détection d’anomalies

deux tables contenant des données pour lesquelles une anomalie potentielle est détectée dans la dernière ligne

Introduction à la qualité des données

Passons à la pratique !

Introduction à la qualité des données

Preparing Video For Download...