Valutazione: metriche e grafici in DVC

Introduzione al versionamento dei dati con DVC

Ravi Bhadauria

Machine Learning Engineer

Metriche: modifiche in dvc.yaml

  • Configura il file YAML di DVC per tracciare metriche tra esperimenti
  • Cambia da outs
stages:
  train_and_evaluate:
    outs:
    - metrics.json
    - plots.png

$$ $$

  • A metrics
stages:
  train_and_evaluate:
    outs:
    - plots.png
    metrics:
      - metrics.json:
        cache: false
Introduzione al versionamento dei dati con DVC

Stampare le metriche DVC

$ dvc metrics show
Path          accuracy    f1_score    precision    recall             
metrics.json  0.947       0.8656      0.988        0.7702
Introduzione al versionamento dei dati con DVC

Confrontare le metriche tra run

  • Modifica un iperparametro e riesegui dvc repro
$ dvc metrics diff
Path          Metric     HEAD    workspace    Change                  
metrics.json  accuracy   0.947   0.9995       0.0525
metrics.json  f1_score   0.8656  0.9989       0.1333
metrics.json  precision  0.988   0.9993       0.0113
metrics.json  recall     0.7702  0.9986       0.2284
Introduzione al versionamento dei dati con DVC

Grafici: modifiche in dvc.yaml

stages:
  train_and_evaluate:
    ...
    plots:
    - predictions.csv: # Nome del file con le predizioni
        template: confusion # Stile del grafico

x: predicted_label # Nome colonna X nel file csv y: true_label # Nome colonna Y nel file csv x_label: 'Predicted label' y_label: 'True label' title: Confusion matrix
cache: false # Salva in Git
1 https://dvc.org/doc/user-guide/experiment-management/visualizing-plots#plot-templates-data-series-only
Introduzione al versionamento dei dati con DVC

Esportare i grafici DVC su file

$ dvc plots show predictions.csv
file:///path/to/index.html

Grafico della matrice di confusione generato da DVC

Introduzione al versionamento dei dati con DVC

Confrontare i grafici DVC

# confronta il grafico in predictions.csv con il branch main
$ dvc plots diff --target predictions.csv <branch name or commit SHA>

Grafico diff della matrice di confusione generato da DVC

Introduzione al versionamento dei dati con DVC

Ayo berlatih!

Introduzione al versionamento dei dati con DVC

Preparing Video For Download...