Öğrenme teknikleri

Large Language Models (LLMs) Kavramları

Vidhi Chugh

AI strategist and ethicist

Neredeyiz?

İnce ayar aşamasına geldiğimizi gösteren ilerleme grafiği

Large Language Models (LLMs) Kavramları

Veri kısıtlarının ötesine geçmek

 

  • Fine-tuning: önceden eğitilmiş bir modeli özgül bir görev için eğitme

 

  • Peki, etiketli veri azsa ya da yoksa?

 

  • N-shot learning: zero-shot, few-shot ve multi-shot
Large Language Models (LLMs) Kavramları

Transfer öğrenme

  • Bir görevden öğrenip ilgili göreve aktarın
  • Bilgiyi piyanodan gitara aktarma
    • Nota okuma
    • Ritim anlama
    • Müzik kavramlarını kavrama
  • N-shot learning
    • Zero-shot - göreve özgü veri yok
    • Few-shot - az göreve özgü veri
    • Multi-shot - nispeten daha çok eğitim verisi

Bir piyano ve bir gitarın illüstrasyonu

Large Language Models (LLMs) Kavramları

Zero-shot learning

  • Açık eğitim yok
  • Dil anlama ve bağlamı kullanır
  • Ön örnek olmadan genelleştirir

At ve çizgileri ayrı ayrı öğrenmenin modelin zebrayı tanımasına nasıl yardım ettiğini gösteren bir görsel.

1 Freepik
Large Language Models (LLMs) Kavramları

Few-shot learning

  • Az sayıda örnekle yeni bir görev öğrenme

Bir sınıfı gösteren bir görsel

  • One-shot learning: tek örnekle ince ayar
  • Yeni sorular için önceki bilgi

Sınav yazan bir çocuğu gösteren bir görsel

Large Language Models (LLMs) Kavramları

Multi-shot learning

  • Few-shot’tan daha çok örnek gerekir

 

  • Önceki görevler + yeni örnekler

 

  • Örneğin Golden Retriever üzerinde eğitilen bir model

Üç Golden Retriever görseli

1 Freepik
Large Language Models (LLMs) Kavramları

Multi-shot learning

  • Model çıktısı: Labrador Retriever

 

  • Veri toplama ve etiketlemede zaman kazandırır

 

  • Doğruluktan ödün vermez

Bir labrador görseli

1 Freepik
Large Language Models (LLMs) Kavramları

Şimdiye kadarki yapı taşları

  • Veri hazırlama iş akışı

 

  • İnce ayar (fine-tuning)

 

  • N-shot öğrenme teknikleri

 

  • Sırada: ön eğitim
Large Language Models (LLMs) Kavramları

Hadi pratik yapalım!

Large Language Models (LLMs) Kavramları

Preparing Video For Download...