Monitoraggio e osservabilità
Concetti di LLMOps
Max Knobbout, PhD
Applied Scientist, Uber
Ciclo di vita LLM: monitoraggio e osservabilità
Monitoraggio e osservabilità
- Il monitoraggio osserva il sistema in modo continuo.
- L'osservabilità rende visibili agli esterni gli stati interni.
- Fonti dati per l'osservabilità:
- Log
- Metriche
- Tracce
Monitoraggio degli input
- Monitora gli input per:
- Variazioni
- Errori
- Contenuti dannosi
- Il data drift è il cambiamento della distribuzione degli input nel tempo
- Per gestirlo servono:
- Monitorare la distribuzione dei dati
- Aggiornare periodicamente il modello
Monitoraggio funzionale
Esempi:
- Tempo di risposta
- Volume richieste
- Downtime
- Tassi di errore
Per app LLM:
- Esecuzione di chain e agent
- Risorse di sistema (GPU)
- Costi
Monitoraggio dell'output
- Usa metriche definite nei test, ad esempio:
- Drift del modello:
- Cambia la relazione tra input e output
- La censura implica intervenire attivamente
Gestione degli alert
- Ricevi notifiche quando emergono problemi
- Procedure chiare
- Possibili SLA (Service-Level Agreement)
Passiamo alla pratica!
Concetti di LLMOps
Preparing Video For Download...