Fine-tuning

Concetti sui Large Language Models (LLM)

Vidhi Chugh

AI strategist and ethicist

A che punto siamo?

Grafico dei progressi che mostra che siamo alla fase di fine-tuning

Pre-training

Un’immagine che rappresenta bambini a scuola come analogia del pre-training

          Istruzione scolastica

Fine-tuning

Un’immagine che rappresenta studenti universitari come analogia del fine-tuning

        Specializzazione universitaria

¹ Freepik

Sfide della “grandezza”

Il fine-tuning può aiutare
Computer potenti
Metodi di training efficienti
Grandi quantità di dati di training

Un’immagine che mostra dati, tempo di training e potenza di calcolo come sfide per costruire LLM

Potenza di calcolo

Memoria
Potenza di calcolo
Infrastruttura
Costoso

LLM:
- Centinaia di migliaia di CPU (Central Processing Unit)
- Decine di migliaia di GPU (Graphic Processing Unit)

PC personale: 4-8 CPU e 1-2 GPU

Uomo che lavora al computer collegato a un grande server

¹ Freepik

Training efficiente del modello

Illustrazione che simboleggia un modello di deep learning

Tempi di training enormi

Possono servire settimane o mesi

Training efficiente = tempi più rapidi

355 anni di calcolo su una singola GPU

Disponibilità dei dati

Servono dati di alta qualità

Per apprendere complessità e sfumature del linguaggio

Qualche centinaio di GB di testo
- Oltre un milione di libri
Quantità di dati enorme

Due pile di raccoglitori stracolmi a simboleggiare molti dati

Superare le sfide

Fine-tuning
- Affronta parte di queste sfide
- Adatta un modello pre-addestrato

Modello pre-addestrato
- Addestrato su dataset generici
- Non ottimizzato per compiti specifici
- Si può fare fine-tuning per un problema specifico

Persone che lavorano su un portatile enorme con strumenti e ingranaggi a simboleggiare il fine-tuning

Fine-tuning vs. Pre-training

Fine-tuning
Calcolo
- 1-2 CPU e GPU

Tempo di training
- Da ore a giorni

Dati
- ~1 gigabyte

Pre-training
Calcolo
- Migliaia di CPU e GPU

Tempo di training
- Settimane o mesi

Dati
- Centinaia di gigabyte

Passons à la pratique !

Concetti sui Large Language Models (LLM)

Preparing Video For Download...