Teknik pembelajaran

Konsep Large Language Models (LLM)

Vidhi Chugh

AI strategist and ethicist

Kita di tahap mana?

Bagan kemajuan menunjukkan kita telah mencapai tahap fine-tuning

Konsep Large Language Models (LLM)

Melampaui keterbatasan data

 

  • Fine-tuning: melatih model pra-latih untuk tugas spesifik

 

  • Namun, bagaimana jika data berlabel sangat sedikit atau tidak ada?

 

  • N-shot learning: zero-shot, few-shot, dan multi-shot
Konsep Large Language Models (LLM)

Transfer learning

  • Belajar dari satu tugas lalu ditransfer ke tugas terkait
  • Transfer pengetahuan dari piano ke gitar
    • Membaca not musik
    • Memahami ritme
    • Menguasai konsep musik
  • N-shot learning
    • Zero-shot - tanpa data spesifik tugas
    • Few-shot - sedikit data spesifik tugas
    • Multi-shot - data latih relatif lebih banyak

Ilustrasi piano dan gitar

Konsep Large Language Models (LLM)

Zero-shot learning

  • Tanpa pelatihan eksplisit
  • Memanfaatkan pemahaman bahasa dan konteks
  • Menggeneralisasi tanpa contoh sebelumnya

Gambar menunjukkan bagaimana pelatihan pada kuda dan garis secara terpisah membantu model mengenali zebra.

1 Freepik
Konsep Large Language Models (LLM)

Few-shot learning

  • Pelajari tugas baru dengan beberapa contoh

Gambar menunjukkan ruang kelas

  • One-shot learning: fine-tuning dari satu contoh
  • Pengetahuan awal untuk menjawab pertanyaan baru

Gambar anak mengerjakan ujian

Konsep Large Language Models (LLM)

Multi-shot learning

  • Butuh lebih banyak contoh daripada few-shot

 

  • Tugas sebelumnya + contoh baru

 

  • Misalnya, model dilatih pada Golden Retriever

Gambar tiga Golden Retriever

1 Freepik
Konsep Large Language Models (LLM)

Multi-shot learning

  • Keluaran model: Labrador Retriever

 

  • Menghemat waktu pengumpulan dan pelabelan data

 

  • Tanpa mengorbankan akurasi

Gambar seekor labrador

1 Freepik
Konsep Large Language Models (LLM)

Bangunan dasar sejauh ini

  • Alur kerja penyiapan data

 

  • Fine-tuning

 

  • Teknik N-shot learning

 

  • Selanjutnya: pre-training
Konsep Large Language Models (LLM)

Ayo berlatih!

Konsep Large Language Models (LLM)

Preparing Video For Download...