Transformeri anlama

Python ile LLM'lere Giriş

Jasmin Ludolf

Senior Data Science Content Developer, DataCamp

Transformer nedir?

  • Derin öğrenme mimarileri
  • Metni işleme, anlama ve üretme
  • Çoğu LLM'de kullanılır
  • Uzun metin dizilerini paralel işler

Üç transformer mimarisi görseli: yalnızca kodlayıcı, yalnızca kod çözücü ve kodlayıcı-kod çözücü

Python ile LLM'lere Giriş

Transformer mimarileri

Üç transformer mimarisi görseli: yalnızca kodlayıcı, yalnızca kod çözücü ve kodlayıcı-kod çözücü

  • Mimari ayrıntıları Hugging Face model kartında bulun
Python ile LLM'lere Giriş

Yalnızca kodlayıcı

Yalnızca kodlayıcı görseli

  • Girdi metnini anlama
  • Sıralı çıktı yok
  • Yaygın görevler:
    • Metin sınıflandırma
    • Duygu analizi
    • Çıkarımsal soru-cevap (çıkar veya etiketle)
  • BERT modelleri
  • Örnek: "distilbert-base-uncased-distilled-squad"
Python ile LLM'lere Giriş

Yalnızca kodlayıcı

Yalnızca kodlayıcı görseli

llm = pipeline(model="bert-base-uncased")
print(llm.model)
BertForMaskedLM(
  (bert): ...
    )
    (encoder): BertEncoder(
      ...
print(llm.model.config)
BertConfig {
...
  "architectures": [
    "BertForMaskedLM"
...
Python ile LLM'lere Giriş

Yalnızca kodlayıcı

Yalnızca kodlayıcı görseli

print(llm.model.config.is_decoder)
False
  • Alternatif: llm.model.config.is_encoder_decoder
Python ile LLM'lere Giriş

Yalnızca kod çözücü

Yalnızca kod çözücü görseli

  • Odak çıktıdadır
  • Yaygın görevler:
    • Metin üretimi
    • Üretimsel soru-cevap (cümle/paragraf)
  • GPT modelleri
  • Örnek: "gpt-3.5-turbo"
Python ile LLM'lere Giriş

Yalnızca kod çözücü

Yalnızca kod çözücü görseli

llm = pipeline(model="gpt2")
print(llm.model.config)
GPT2Config {
...
  "architectures": [
    "GPT2LMHeadModel"
  ],
...
  "task_specific_params": {
    "text-generation": {
...
print(llm.model.config.is_decoder)
False
Python ile LLM'lere Giriş

Kodlayıcı-kod çözücü

Kodlayıcı-kod çözücü görseli

  • Girdi ve çıktıyı anlar ve işler
  • Yaygın görevler:
    • Çeviri
    • Özetleme
  • T5, BART modelleri
Python ile LLM'lere Giriş

Kodlayıcı-kod çözücü

Kodlayıcı-kod çözücü görseli

llm = pipeline(model="Helsinki-NLP/opus-mt-es-en")
print(llm.model)
MarianMTModel(
...
    (encoder): MarianEncoder(
...
    (decoder): MarianDecoder(
...
Python ile LLM'lere Giriş

Kodlayıcı-kod çözücü

Kodlayıcı-kod çözücü görseli

print(llm.model.config)
MarianConfig {
...
  "decoder_attention_heads": 8,
...
  "encoder_attention_heads": 8,
...
  "is_encoder_decoder": true,
...
print(llm.model.config.is_encoder_decoder)
True
Python ile LLM'lere Giriş

Ayo berlatih!

Python ile LLM'lere Giriş

Preparing Video For Download...