Detección de anomalías

Introducción a la calidad de datos

Chrissy Bloom

Head of Enterprise Data Strategy & Governance

Definición de la detección de anomalías

Detección de anomalías: cuando se utiliza un algoritmo de machine learning para aprender sobre un conjunto de datos a partir de datos históricos e identifica posibles problemas en la calidad de los datos.

lupa con un reloj que indica el seguimiento en el tiempo y una flecha que señala una tabla con una posible anomalía detectada

Introducción a la calidad de datos

Ventajas de la detección de anomalías

Ventajas:

  • Monitoriza los datos a escala frente a solo los elementos de datos críticos.
  • Requiere pocos conocimientos empresariales para la configuración porque el algoritmo de machine learning aprende cómo son los errores.
  • Puede detectar la desviación de los datos y conclusiones extraídas de los datos que no resultan evidentes.

diagrama con varias fuentes de datos diferentes que simboliza la calidad de los datos a escala

Introducción a la calidad de datos

Uso de la detección de anomalías

  1. Cuando se dispone de una gran cantidad de datos
  2. Cuando una gran cantidad de datos requiere la supervisión de su calidad
    • mínimo trabajo manual necesario
    • establecer la supervisión a escala
    • automatizar la búsqueda de anomalías en los datos

tres filas de texto sobre el uso de la detección de anomalías, la detección y la prevención

Introducción a la calidad de datos

Ejemplo de detección de anomalías

dos tablas con datos en los que se detecta una posible anomalía en la última fila

Introducción a la calidad de datos

¡Vamos a practicar!

Introducción a la calidad de datos

Preparing Video For Download...