Detectie van multivariate drift

Monitoring Machine Learning in Python

Hakim Elakhrass

CEO and co-founder

Wat is multivariate driftdetectie?

  • Eerste stap van root-causeanalyse
  • Resultaat is één getal voor alle features
  • Detecteert subtiele dataveranderingen

De afbeelding toont de monitoring-workflow en waar multivariate-driftdetectie daarin staat.

Monitoring Machine Learning in Python

Hoe werkt het?

  1. Data comprimeren met het PCA-algoritme
  2. Data decomprimeren naar de oorspronkelijke vorm met inverse PCA
  3. Reconstructiefout meten; een toename duidt op drift

De afbeelding toont hoe multivariate driftdetectie werkt.

Monitoring Machine Learning in Python

Code-implementatie

# Initialize multivariate drift detection calculator
mv_calc = nannyml.DataReconstructionDriftCalculator(
    column_names=features_column_names,
    timestamp_column_name='timestamp',
    chunk_period='m'
    )
# Fit and calculate the results
mv_calc.fit(reference)
mv_results = mv_calc.calculate(analysis)
Monitoring Machine Learning in Python

Resultaten plotten

mv_figure = mv_results.filter(period='analysis').plot()
mv_figure.show()

De afbeelding toont de reconstructiefout in de tijd.

Monitoring Machine Learning in Python

Multivariate drift vs. gerealiseerde performance

figure = mv_results.filter(period='analysis').compare(perf_results).plot()
figure.show()

De afbeelding toont de vergelijkingsgrafiek met gerealiseerde performance en reconstructiefout.

Monitoring Machine Learning in Python

Laten we oefenen!

Monitoring Machine Learning in Python

Preparing Video For Download...