Als labels beschikbaar zijn

Monitoring Machine Learning in Python

Maciej Balawejder

Data Scientist

Geschat vs. gerealiseerd

Geschatte performance:

meet hoe goed het model naar verwachting presteert
bepaald met estimators zoals CBPE en DLE
geschat als ground truth ontbreekt

Gerealiseerde performance:

is de gemeten performance
bepaald met een performance-calculator
berekend als ground truth beschikbaar is

Vertraagde ground truth

De tijdlijn toont per week drie punten. Elke maandag wordt de gerealiseerde performance van het model geëvalueerd; tussendoor schat de CBPE-estimator de performance.

Performance-calculator

# Initialiseer de calculator
calc = nannyml.PerformanceCalculator(
    y_pred_proba='y_pred_proba',
    y_pred='y_pred',
    y_true='arrived',
    timestamp_column_name='timestamp',
    problem_type='classification_binary',
    chunk_period='d',
    metrics=['roc_auc', 'accuracy'],
    )

# Fit de calculator
calc.fit(reference)
realized_results = calc.calculate(analysis)

Resultaten plotten

# Toon plot van gerealiseerde performance
results.plot().show()

De afbeelding toont de gerealiseerde ROC AUC-grafiek, met een daling van april 2019 tot augustus 2019.

Gerealiseerde vs. geschatte performance

# Schat en bereken resultaten
estimated_results = estimator.estimate(analysis)
realized_results = calculator.calculate(analysis)


# Toon vergelijkingsplot
realized_results.compare(estimated_results).plot().show()

Gerealiseerde vs. geschatte performance

De plot vergelijkt de gerealiseerde en geschatte performance voor de ROC AUC-metriek.

Laten we oefenen!

Monitoring Machine Learning in Python