Dil modellemenin zorlukları

Large Language Models (LLMs) Kavramları

Vidhi Chugh

AI strategist and ethicist

Sıra önemlidir!

 

  • Yalnızca sağlıklı bir yaşam tarzı izlerim.

 

 

  • Farklı konumlar = farklı anlamlar

 

  • Yalnızca ben sağlıklı bir yaşam tarzı izlerim.

Zıt yönlere bakan iki ok ve başında soru işareti olan bir kişiyi gösteren illüstrasyon.

1 Freepik
Large Language Models (LLMs) Kavramları

Bağlam modelleme

Bağlama bağlı olarak 'Run' kelimesinin birden çok anlama gelebileceğini gösteren görsel.

Large Language Models (LLMs) Kavramları

Bağlam modelleme

Jogging anlamında 'Run' kelimesini gösteren görsel.

Large Language Models (LLMs) Kavramları

Bağlam modelleme

Yönetmek ya da düzenlemek anlamında 'Run' kelimesini gösteren görsel.

Large Language Models (LLMs) Kavramları

Bağlam modelleme

Bir makineyi çalıştırmak anlamında 'Run' kelimesini gösteren bir görsel

Large Language Models (LLMs) Kavramları

Bağlam modelleme

Farklı bağlamsal anlamları örneklerle destekleyerek önceki görsele daha fazla bağlam ekleme.

Large Language Models (LLMs) Kavramları

Uzun menzilli bağımlılık

 

  • Bir cümlede uzaktaki sözcükleri tanıyıp ilişkilendirme
  • Geleneksel dil modelleri için zorlu

Uzun menzilli bağımlılığa bir örnek: "Tatilinden yeni dönen genç kızın dikkatlice rafa koyduğu kitap oldukça ağırdı."

Large Language Models (LLMs) Kavramları

Tek görevli öğrenme

Görüntü altyazılama, metin özetleme ve çeviri gibi tek görevli öğrenmeye üç örnek gösteren görsel.

  • Zaman ve kaynak açısından maliyetli
  • Modern LLM'lere göre daha az esnek
Large Language Models (LLMs) Kavramları

Çok görevli öğrenme

Bir modelde birden çok yeteneği birleştiren çok görevli öğrenmeyi gösteren görsel.

  • Her bir görevde daha iyi performans
  • Doğruluk ve verim etkilenebilir
  • Veriler paylaşıldığı için daha az eğitim verisi gerekir
Large Language Models (LLMs) Kavramları

Özetle

Dil modellemenin zorlukları:

  • Sözcük dizileri

 

  • Bağlamı anlama

 

  • Uzun menzilli bağımlılık

Tek görevli öğrenme:

  • Göreve özgü
  • Daha az esnek
  • Geleneksel modeller ve erken LLM'ler

 

Çok görevli öğrenme:

  • Çok yönlü
  • Birden çok görev
  • Daha gelişmiş LLM'ler
Large Language Models (LLMs) Kavramları

Hadi pratik yapalım!

Large Language Models (LLMs) Kavramları

Preparing Video For Download...