RAG vs fine-tuning

Concetti di LLMOps

Max Knobbout, PhD

Applied Scientist, Uber

Ciclo di vita LLM: RAG vs fine-tuning

Panoramica delle fasi del ciclo di vita di un’app LLM

Concetti di LLMOps

Retrieval Augmented Generation (RAG)

Cartone giocoso che usa una banana per alimentare un tablet

 

  • Combina il ragionamento degli LLM con conoscenza esterna.
  • Tre step in una chain:

    1. Retrieve documenti correlati
    2. Augment il prompt con esempi
    3. Generate l’output
  • Spesso implementato con database vettoriali.

Concetti di LLMOps

Catena RAG con database vettoriale

  1. Retrieve:
    • Converte l’input in embedding
    • Cerca nel database vettoriale
    • Recupera i documenti più simili

Catena di recupero

Concetti di LLMOps

Catena RAG con database vettoriale

  1. Retrieve:
    • Genera embedding dall’input
    • Cerca nel database vettoriale
    • Recupera i documenti più simili
  2. Augment:
    • Combina input e documenti per creare il prompt finale

Catena di arricchimento

Concetti di LLMOps

Catena RAG con database vettoriale

  1. Retrieve:
    • Genera embedding dall’input
    • Cerca nel database vettoriale
    • Recupera i documenti più simili
  2. Augment:
    • Combina l’input con i top-k documenti e crea il prompt arricchito
  3. Generate:
    • Usa il prompt per creare un output

Molte scelte d’implementazione e modelli di embedding. Sperimenta e testa!

Catena di generazione

Concetti di LLMOps

Fine-tuning

 

Immagine giocosa di un cartone con un abito su misura

 

 

  • Regola i pesi dell’LLM
  • Estende a task e domini specifici:
    • Lingue diverse
    • Settori specialistici
Concetti di LLMOps

Fine-tuning

Fine-tuning supervisionato                             (transfer learning)

Dati necessari 📂:

  • Dati di dimostrazione (input con output desiderati)

Reinforcement Learning from Human Feedback (RLHF)

Dati necessari 📂:

  • Ranking o punteggi di qualità (da like e dislike)

Approccio 🔍:

  • Ri-addestra (parti del) modello

Approccio 🔍:

  • Addestra un modello di ricompensa extra
  • Ottimizza l’LLM originale per massimizzarlo
Concetti di LLMOps

RAG o fine-tuning

RAG
  • Usa quando devi includere conoscenza fattuale
  • ✅ Mantiene le capacità dell’LLM, facile da implementare, sempre aggiornato
  • ❌ Aggiunge componenti extra, richiede ingegneria accurata

Cartone giocoso che usa una banana per alimentare un tablet

Immagine giocosa di un cartone con un abito su misura

Fine-tuning
  • Usa quando serve specializzare in un nuovo dominio
  • ✅ Pieno controllo e nessun componente extra
  • ❌ Richiede dati etichettati e competenze specialistiche, rischio di amplificare bias e di forgetting catastrofico
Concetti di LLMOps

Il ciclo di sviluppo

Ciclo di sviluppo con l’attività di sviluppo di chain e agent

Concetti di LLMOps

Il ciclo di sviluppo

Ciclo di sviluppo con l’attività di RAG

Concetti di LLMOps

Il ciclo di sviluppo

Ciclo di sviluppo con l’attività di fine-tuning

Concetti di LLMOps

Ayo berlatih!

Concetti di LLMOps

Preparing Video For Download...